扫码打开虎嗅APP
本文来自微信公众号:城市数据团 (ID:metrodatateam),作者:chenqin,原文标题:《我们合成了一整座城市的人口信息——城市餐饮与生活服务商业数据研究之二》,头图来自:视觉中国
在《什么样的餐饮店更容易存活?》这篇文章中,我们针对个体店铺,研究了什么样的店铺有着更强的存活能力。
而对于一个区域来说,餐饮、生活服务店铺的消失并不一定是一件坏事,若是同时出现一些更有活力的新店铺,形成店铺的健康迭代,对于保持这个区域的商业活力将更有好处。
因此,在这篇研究中,我们将同时考虑旧店铺的“消失”和新店铺的“出现”,看看什么样的区域里店铺正在净增长。
一、店铺净增长的街镇有哪些?
将店铺数据归集到上海和成都共487个街道中,计算从2023年1季度到2023年2季度各区域的店铺变化,下表为上海市和成都市的店铺净增率最大和最小的20个街镇:
从以上两张表格我们可以得出一些初步印象:
1. 上海市店铺增长最快街镇,大部分集中在郊区。例如松江区和浦东新区在前20名中均占据5席,其中浦东新区的5个街镇均分散在距离市中心30公里以上的远郊区。在外环以内的高速增长街镇,只有普陀区的长寿路街道,和静安区的天目西路街道两个。
2. 上海市店铺增长率最慢,或者是净减少最明显的街镇,基本都出现在市中心,前四名分别是静安区的宝山路街道、黄浦区的老西门街道、虹口区的凉城新村街道以及黄浦区的小东门街道,这些街道的商铺均出现了7%以上的净减少。
3. 成都市增长最快的街道基本分布在双流区和郫都区,分别处于成都市市中心的西南与西北部,青羊区的康河街道则处于成都市中心的正西方。
4. 成都市商铺减少最多的区域则集中在崇州市、彭州市、大邑市、邛崃市等区域,这些区域同样处在成都市中心的西南到西北方向。虽然净减少最快和净增长最快的区域所处方位类似,但经济中心自西向东移动的趋势十分明显。另外,虽然表格中没能完全显示,成都市中心靠东的地区,包括简阳市、龙泉驿区等地区,不少街镇的商铺增长也名列前茅。
二、一种合成虚拟微观人口的新方法
如果只是从方位、区域研究街镇增长背后的成因,结果可能更难具有预测性以及操作性。每个区域的人口年龄性别结构、教育、婚育、就业、家庭构成等一系列人口特征,才是一个地区商业变化的基础推动力量。
但若我们要将人口特征纳入街镇层面的研究时,又会碰到新的问题,那就是人口数据的缺失。
人口普查数据存在着4个层面的公开数据,分别是全国范围内的《中国人口普查年鉴》;在各省、直辖市与自治区层面的各地人口普查年鉴;县层面的《2020中国人口普查分县资料》以及街镇层面的《2020中国人口普查分乡、镇、街道资料》,均从加总层面给出该区域的汇总人口特征。
然而,越是细颗粒的地理层级,数据字段越少。2020年的街镇层面数据仅有三段人口年龄结构、65岁以上人口数量,以及在本乡镇街道人户一致人口,一共5个指标可用,用五个指标来解释一个城市内动辄上百个街镇的增长差异,就有一些力不从心了。
为了从汇总指标中反演微观人口数据,规划学、地理学的学者发明了一系列虚拟人口合成方法。举个例子,人口普查给出了100万人口的汇总性别比例、年龄结构、教育分布,那么研究人员就可以根据这些信息,生成100万条虚拟人口数据,每一个虚拟人口均有其性别、年龄和教育变量,且这100万条虚拟人口数据的性别、年龄和教育的汇总结果和人口普查给出的汇总数据完全一致。将这100万条微观人口数据分布在空间上,成为100万个可以独立行动的个体,便可开展行为模拟,例如交通模拟、公共设施使用模拟、公共卫生事件模拟等,帮助进行更复杂的研究。
但是,虚拟人口合成的方法高度依赖于数据的可得性,使用的汇总数据维度越多,样本的联合分布信息越丰富,那么虚拟人口的合成才能更接近真实。以100万人口的人口合成为例,如果仅有汇总的性别比例、年龄结构、教育分布,却没有年龄与教育的联合分布,合成的人口中可能就会包含“3岁男孩已经是研究生”等失真组合的虚拟人口。
因此,在人口普查给出的汇总数据指标基础上,我们还需要加入一系列微观数据,并使用这些微观数据得出的联合交叉分布,才能使合成出的虚拟人口更加贴近现实中的人口。
使用目前为止可获得的最丰富的数据,我们合成的虚拟人口包括以下指标生成过程:
1. 使用人口普查的个体微观数据,确定在每一街镇内的人口年龄、性别、教育程度各自的分布以及联合分布。
2. 使用人口普查的家庭微观数据,确定每一街镇内的家庭构成逻辑,包括夫妻间的年龄、教育程度的联合分布;子女的年龄与教育程度和夫妻特征的联合分布。
3. 使用人口普查微观数据、人口普查分区县的职业、行业数据以及招聘数据的分布,确定不同年龄、性别、教育程度的人口在不同居住地点和工作地点的职业、行业从事情况,并能够在每个虚拟个体的性别、年龄、教育、职业、行业基础上计算其收入状况。
4. 使用住房与社区数据,包括租金、房型、房龄以及人口普查微观数据中不同特征的人口和家庭在与不同房型和房龄和租金的联合分布,在街镇内将虚拟人口分布至每一居委或社区内,为虚拟人口加入居住情况属性。
5. 使用从CFPS、CHFS中获得的人口面板数据以及人口普查微观数据中的一年和五年迁移概率,计算不同个人特征、家庭特征的人口每年的死亡率、婚育行为、就业与教育的变迁矩阵和迁移矩阵,使得人口可以人口与家庭为单位模拟各项决策,包括出生、成长、受教育、就业、与其他虚拟合成人口婚配、购买何地何种住房等。该方法使得人口合成可以动态演进,在通过2020年普查数据合成人口后,动态演进到2023年仍然保持与现实数据的高度一致性。
使用这些数据,我们已经形成了全国重点城市的人口合成结果,包括北京、上海、广州、深圳、杭州与成都,在这些地区,形成了在宏观、微观与时序上均和现实人口特征相一致的“人口元宇宙”。
囿于篇幅所限,本文将直接使用通过该方法算出的上海与成都市各街镇的人口年龄性别结构、教育结构和收入结构,我们将在未来的文章中对构造人口元宇宙的方法进行详细介绍。
三、店铺净增长的街镇有哪些特征?
我们使用上海和成都共455个街镇的店铺增长率与每个街镇的人口特征交互,可以得出下列结果。
1. 人均年收入80000元:街镇消费增速的顶点
如果去观察世界上所有国家的经济增速,我们不难发现,最发达的国家和最不发达的国家增速往往较低,而处在弯道超车阶段的发展中国家的增速会更高。
街镇的商业同样如此。
我们将各街镇的人均年收入、人均教育年限和各街镇的商铺净增率进行对比,可得以下两张图。
可以看到,随着这两项和人均GDP最相关的指标上升,街镇的商铺净增率呈现了明显的倒U型,其顶点出现在人均年收入80000左右(2020年口径)和人均教育年限10.3年左右。两图的蓝点和橙点分别表示成都和上海的街镇,可以看到,成都大部分的街镇仍然处在倒U型的左半边,仍有许多街镇有着高速发展的空间;上海的大部分街镇则已经越过了高点,随着各类人均指标的进一步增长,增速开始下滑了。
街镇的成长,就和人们自身一样。在刚开始工作收入较低时,消费欲望的上升甚至能超过收入的上升,每多收入一元恨不能当成两元来花;而当越过某一个高点时,这样的消费欲望便减退了。
2. 哪些人群可能带来更高的消费力?
使用从0到80岁、每5岁区间的分性别人口占比,我们可以计算不同年龄、性别的人口和当地商铺增长率之间的关系。
上图中,横坐标为年龄、纵坐标为与当地商铺净增率之间的关系,蓝色实线表示男性,红色实线表示女性。在红色虚线上方的部分,表示这个年龄、性别的人口对于当地商铺净增起到了正向作用,反过来则表示负向作用。
从上图不难发现,当一个街镇的0~9岁儿童越多,以及15~34岁青年占比越高时,这个地区的商铺越倾向于增长。35~44岁的人口和50岁之后的人口占比越高,则会使该街镇的净增率更低。年龄越大,对于街镇商铺的负影响也越为明显。一个80岁老人使得街镇商铺减少的比例,几乎要二到三倍于25岁年轻人带来商铺增长的比例。
另外,从上海与成都共同计算的这张图中,我们也不难发现男性和女性之间存在明显区别。如果将这个图表的纵坐标,称之为不同年龄、性别人口的“消费力”,那么在0~9岁,男孩的消费力要大于女孩,而在25~29岁,女青年的消费力要高于男青年。
我们再将上海与成都分开计算,可以得到以下两图:
可以看到,两个城市的不同年龄、性别人口的消费力趋势总体相似,都是儿童、青年会带来正的消费力,而老年人带来负的消费力,但是在性别关系上则存在较大差异。在上海,女性的消费力从20岁到60岁均高于男性,其差异在25岁和40岁时达到顶峰。而在成都,反而是男青年的消费力高于女性,尤其是在35~44年龄段。男性的消费力达到女性的两倍以上。
不同年龄、性别人口为街镇商业带来的消费力差异,其实指向了类似的角度。老年人始终带来负的消费力。而青年人口,尤其是25~40岁阶段的人口,带来的消费力提升是最显著的。有的城市可能男性更大,而另一些城市可能女性更高,这和当地的产业环境与文化环境可能相关。此外,0~4岁的人口增加也能带来一波消费力提升,在这个年龄段中,男孩带来的消费力提升似乎稳定地高于女孩。
也许是男孩太皮了所以带来的消费更多?总之,这也是挺有趣的一个现象。
3. 未来增长的街镇有哪些?人口变迁视角
比起收入、教育、产业等指标,人口指标在各个地区是相对稳定的。一个街镇的40~44岁人口,如果不迁徙,也没有死亡,那么5年后就自然成为这个街镇的45~49岁人口,从而带来不同的消费力。
那么很显然,如果一个地区的人口都是20岁,那么5年后他们25岁时,就会给当地带来更多的消费力提升。如果一个地区的人口都是60岁,那么5年后他们65岁时,带来的就是更多消费力下降。
根据这个逻辑,计算每个年龄段在当前和未来五年的变化,我们就能算出5年之后上海和成都的各街镇消费力提升最高和最低的20名,见下表。(由于出生人口难以预测,我们这里的研究仅仅考虑了人口的跨街镇迁徙以及各年龄死亡率。)
可以看到,无论是上海还是成都,未来五年由于人口结构变动带来的消费力变迁上涨最快的街镇,基本以郊区为主,例如上海的金山、奉贤,成都的大邑、蒲江。
虽然郊区的增长更明显,但上海市区也并非没有增长的空间。在上海市,普陀区的长风新村街道、真如镇街道,五角场、徐家汇、虹口嘉兴路等街道,在五年之后依然能因人口结构的变化带来更多消费能力。
此外,上海市一共有11个街道会因为人口结构的变化带来消费能力的下降,包括地处市中心的半淞园街道、湖南路街道等。
相比之下,成都的情况就要好得多,没有一个街镇会因为人口结构变化而出现消费力下降。即便是成都消费能力提升最低的地区,成华区的青龙街道和武侯区的桂溪街道,消费力提升虽然只有0.1左右,同样的数字在上海已经能够名列前20。
四、结语
使用一种全新的人口合成方法,我们合成了上海和成都的4600万人口,他们在街镇、区县和总量上的各项指标的分布与联合分布均与现实一致。使用这些人口信息,我们计算了不同街镇商铺增长率和人口指标之间的关系,发现了一些有趣的特征。
第一,随着街镇的人均教育年限、人均收入上升,街镇的商铺增长率会先上升再下降,其转折点出现在人均年收入80000元左右。上海大部分街镇已经超过了这个转折点,而成都的大部分街镇仍然在转折点之前。
第二,不同性别、年龄的人口隐含着不同的“消费力”,其中儿童与青年人口的消费力更高。在儿童阶段,男孩的消费力高于女孩;在青年阶段,上海市的女青年消费力高于男青年,而成都市则相反;在老年阶段,年龄越大,拉动商铺增长的消费力负值越高。
第三,随着人口变迁,成都市各街镇的消费力会在五年后出现较大增长,但上海的各街镇消费力提升已经不明显,还有若干区域会出现人口拉动的消费力下降。
人口结构的变化,尤其是青年人口的变化,在中国未来几年的消费贡献中,将越来越成为一种不得忽视的力量,即便是在街镇层面,我们依然能看到这种力量带来的潜在变化。
本文来自微信公众号:城市数据团 (ID:metrodatateam),作者:chenqin