扫码打开虎嗅APP
本文来自微信公众号:经观书评 (ID:jingguanshuping),作者:张健康,原文标题:《如何正确理解政府统计数据》,题图来自:视觉中国
政府统计数据是宝贵的经济社会资源,正确地使用政府统计数据,对于客观准确地判断经济社会发展形势、制定出科学合理的经济社会发展政策、得出具有重要理论和应用价值的学术研究成果,都很重要。
政府经济统计数据受到的关注越来越高,以至于一些重要的数据经常成为社会讨论的焦点。虽然政府统计部门一再做出澄清和解释,但是每当有重要的统计数据发布,社会上总会传出不同的声音。各种声音究竟孰是孰非,很需要具备高度专业知识的专业人士做出专业的回答。
2023年6月,北京大学国家发展研究院特约研究员许宪春出版了《透视中国政府统计数据:理解与应用》一书,力图从理论梳理、案例解析和实际应用层面,对目前公众、学界和政策层最为关注的几项政府统计数据,包括GDP、居民可支配收入、消费、投资、进出口,进行释疑解惑,以期达到定纷止争的目的。借着新书出版的机会,《经济观察报》对许宪春特约研究员进行了专访。
《透视中国政府统计数据:理解与应用》,许宪春/著
社会科学文献出版社,2023年6月
为什么统计数据与直观感受会有反差
《经济观察报》:许老师,我们就从刚刚公布的几项政府统计数据谈起吧。
7月中旬,国家统计局公布了2023年上半年中国经济增长的主要数据,随后社会上又出现了不同的声音。您如何看待此现象?
许宪春:某些民众的直观感受与政府统计数据存在反差是一种比较常见的现象。不同的群体往往从不同的角度去看政府统计数据的,角度不同,对统计数据的感觉是不一样的。
比如说居民人均可支配收入。国家统计局发布的全国居民人均可支配收入是根据对全国16万个调查样本户进行调查得到的数据计算出来的。代表全国的16万个样本户,有高收入户、中高收入户、中等收入户、中低收入户和低收入户,等等。
不同的群体,对全国居民人均可支配收入的感受是不一样的。高收入群体可能会觉得国家统计局公布的全国居民人均可支配收入太低了,而低收入群体则会觉得太高了。一个高收入家庭的收入可能相当于若干个中低收入家庭的收入,16万个样本户的收入平均下来,大概率不会是一个中位数,而更可能处于中位数之上,所以即使在16万个样本户中,也有相当一部分样本户的人均收入会落到全国居民人均可支配收入之下,因此可能会有相当一部分人感觉到国家统计局公布的全国居民人均可支配收入偏高了。
再比如CPI涨幅,中低收入群体的感受更可能与国家统计局公布的统计数据产生反差。粮食、蔬菜、水果、猪肉等日用消费品的价格变动,大家会很敏感,而对彩电、冰箱、洗衣机、电脑、汽车等耐用消费品的价格变动,则不会经常感觉到。
计算CPI涨幅时,日用消费品和耐用消费品会放进同一个篮子里计算。计算出来的结果,如果是涨幅收窄了,其原因可能是耐用消费品降价了,日用消费品的价格没变,甚至还有上涨,购买耐用消费品较少的中低收入家庭就会认为政府公布的统计数据与自己实际感受到的物价变动不符。
《经济观察报》:类似的情况,欧美发达国家存在吗?
许宪春:不同的群体对统计数据感受不一样,国外存在同样的问题。
2003年,我陪同时任国家统计局局长到意大利统计局去访问。我们到意大利统计局局长办公室,该局局长开门见山地问我们:“你们知道街上的人游行是为什么吗?”我们说不知道。那位局长告诉我们,意大利统计局刚刚发布意大利经济增长数据,数据表明意大利经济已经恢复了正增长,但是游行的人说:“我们连工作还没有,经济怎么可能恢复正增长呢?”他们认为统计局数字造假了。但是另一面,意大利经济部又抱怨说:“意大利经济早已经恢复正增长,统计数据太滞后了。”
意大利是一个发达经济体,某些群体的感受和政府公布的数据之间依然存在着很大的反差。
为什么有些统计数据会打架
《经济观察报》:一些人对统计数据提出质疑是因为发现来自不同渠道的数据差别很大,即我们常说的“数据打架”问题。
许宪春:统计数据之间出现不一致,存在多种情况。比如说GDP,自从建立核算制度以来,中国地区生产总值汇总数据与国家统计局核算的全国GDP数据曾经长期存在不一致的情况,多数时候是地方汇总数据明显高于国家统计局核算数据。于是就有人质疑,全国GDP数据不是通过对地区生产总值数据汇总出来的吗?怎么会全国GDP数据明显低于地区生产总值汇总数据呢?
实际上,全国GDP数据不是地区生产总值数据的汇总,从生产角度,全国GDP数据是国家统计局按照一个一个行业计算增加值,然后再汇总得出来的。2018年第四次全国经济普查以前,中国采取的是分级核算制度,即国家统计局核算全国GDP数据,地区统计局按照国家统计局制定的核算方法核算本地区生产总值数据。
2012年以前,还没有建立企业一套表联网直报统计调查制度,一些地方经济发展不太好,但又想要政绩,就有可能对数据进行干预,所以地区生产总值数据汇总明显高于国家统计局核算出来的全国GDP数据。
第四次全国经济普查以后,情况有了很大的改观:一是对地区生产总值采取统一核算,即国家统计局在核算全国GDP数据的同时,组织省一级统计局统一核算省一级地区生产总值数据;省一级统计局统一组织市一级统计局核算市一级地区生产总值数据;市一级统计局统一组织县一级统计局核算县一级地区生产总值数据。数据从国家到省级再到市级、县级,逐级定下来,全国GDP数据和地区生产总值汇总数据就能基本衔接。
二是当时已经建立起企业一套表联网直报统计调查制度,规模以上工业企业,有资质的建筑业企业,限额以上批发和零售业企业、限额以上住宿和餐饮业企业和房地产开发企业,通过联网直报系统直接上报企业统计资料,省一级、市一级、县一级统计局被授予审核、汇总本地区企业数据的权限,但无权修改,如果发现问题,需要追溯到企业,企业认为数据错了才可以修改,从而避免了中间环节对统计数据的干扰。
三是对部分小企业进行抽样调查,弥补了过去的一些数据不足。四是两个普查年度之间的GDP数据,一般以后一个普查年度数据为基础,对利用常规统计调查数据核算出来的GDP数据进行修订,以保证常规年度GDP数据与普查年度GDP数据之间的连续性和可比性。
全国GDP数据是怎么最终确定下来的呢?国家统计局每个季度都会召开GDP数据审核评估会,国家统计局领导和各业务司负责同志一起对GDP数据和各专业统计数据进行审核评估,如果发现GDP数据与专业统计数据之间、各专业统计数据之间存在矛盾,就要查找原因,对存在问题的统计数据进行纠正。
各专业司经常派专业统计人员到地方去检查数据质量,发现统计数据与实际情况不符甚至弄虚作假的情况,坚决予以纠正;2017年,国家统计局成立了执法监督局,对统计弄虚作假的行为进行执法检查,依法予以查处,以保证统计数据的真实性。
《经济观察报》:是不是还有一个重要的因素:一些重要的统计指标的含义被误读?
许宪春:统计是一个专业性技术性很强的工作,对于一些重要统计指标,读者的理解与统计规范之间经常会出现不一致的情况。比如居民可支配收入,有的人可能认为很简单。但在政府统计中,居民可支配收入包括资金流量核算中的居民可支配收入和住户调查中的居民可支配收入。两个统计指标在基本用途、口径范围、资料来源和计算方法等方面均存在区别,数据表现自然会有差别。
比如2018年至2020年间,资金流量核算中的居民可支配收入是利用住户调查资料直接推算得出的居民可支配收入的1.3倍左右,有的年度甚至达到1.4倍。
再比如我们经常使用的GDP。一提到GDP,许多人会认为自己很了解,但是有多少人对GDP的基本理论、核算方法了解得很清楚呢?举一个比较典型的例子,2020年一季度,国家统计局公布的数据,中国经济同比下降6.9%,但是同期社会消费品零售总额同比下降19%,固定资产投资下降16.1%,海关统计的货物贸易顺差下降80.6%。一些人就质疑,社会消费品零售总额、固定资产投资和货物贸易顺差降幅都超过两位数,GDP怎么可能只下降6.9%呢?GDP降幅肯定被低估了。
事实上,这些人对相关统计指标之间的关系不是很清楚,直接用社会消费品零售总额的变动判断消费需求的变动,直接用固定资产投资的变动判断投资需求的变动,直接用海关统计的货物贸易顺差的变动判断净出口需求的变动。
就拿消费需求来说,消费需求包括居民消费支出和政府消费支出,居民消费支出又包括通过货币购买的货物和服务支出和不通过货币购买的货物和服务支出(即虚拟消费支出),比如农民自产自用的粮食、蔬菜和水果,它们属于居民消费支出,但是因为没有进入市场,没有用货币进行交易,就没有被纳入社会消费品零售总额。又如居民自有住房服务不属于商品,也没有包括在社会消费品零售总额中。
由于大部分虚拟消费支出不受疫情的影响,2020年一季度虚拟消费支出不仅没有下降反而是增长的。政府消费支出包括公共服务支出和政府部门承担的个人消费货物和服务的支出。2020年一季度,公共服务支出降幅较小。2020年一季度虚拟消费支出和公共服务支出的上述表现一定程度上减缓了疫情对居民消费支出和政府消费支出的冲击,所以消费需求并没有像社会消费品零售总额那样大幅下降,而是降幅相对较小。
如何正确使用政府统计数据
《经济观察报》:您能不能为我们应该如何使用政府统计数据提供一些建议?
许宪春:政府统计数据是宝贵的经济社会资源,正确地使用政府统计数据,对于客观准确地判断经济社会发展形势、制定出科学合理的经济社会发展政策、得出具有重要理论和应用价值的学术研究成果,都很重要。要正确使用政府统计数据,应该把握以下四个原则:
一是要根据所研究的问题正确地选择政府统计数据。正确选择政府统计数据有三个原则,即代表性、质量好、一致性。
二是要准确地了解政府统计数据的分类标准、调查范围、调查方法和采集方式。政府统计数据的分类标准、调查范围、调查方法和采集方式会随着经济社会发展实际情况的变化而被调整,只有准确地了解了它们的变化,才能够正确使用它们。
三是要准确地理解政府统计指标的口径范围和计算方法。中国政府统计中许多指标的口径范围和计算方法都曾发生过变化,有的变化还非常大,比如收入法GDP核算中涉及的劳动者报酬的口径范围就经历过两次大的调整,不了解它们的变化,会直接影响到研究结果的科学性和客观性。
四是要准确地把握政府统计指标的适用范围和相关统计指标之间的关系。准确把握相关统计指标的关系,主要是为了解决无法获得所需统计指标的数据,被迫利用与之相关的能够获得数据的统计指标进行正确推断的问题。
《经济观察报》:如果涉及历史数据呢?
许宪春:使用历史数据,最重要的是要注意到相应统计指标的统计制度是否发生过变化。随着经济社会的迅速发展和科技的不断进步,统计制度是不断变化的,包括统计指标的定义、口径范围、资料来源、计算方法、适用范围等,都有可能发生变化。有些历史数据,特别是GDP核算历史数据,如果口径范围、资料来源、计算方法等方面发生重大变化,为了保证历史数据的连续性和可比性,国家统计局会对相应的历史数据进行系统修订。
对于修订过的历史数据,要注意使用新的数据,不要使用未经过修订的数据,否则就有可能存在历史数据不连续和不可比的问题,可能会影响到研究结果的科学性和客观性。国家统计局建立了一个国家数据库,里面的历史数据都是修订过的,可比的。但是早期出版的统计年鉴中的数据很可能是没有修订过的,使用时需要注意。
对于没有修订过的历史数据,就必须注意它的连续性和可比性。如果自己根据研究问题的需要进行修订的时候,一定要详细了解相应统计指标的口径范围、资料来源、计算方法等方面是否发生过重大变化,以及发生过什么样的变化,查找相应的参考资料,比如相应年度的专业统计年鉴,因为专业统计年鉴发布的统计数据比较详细,便于根据研究问题的需要,针对相应统计指标的口径范围、资料来源、计算方法等方面的变化对相应的数据进行修订。
《经济观察报》:许老师能不能举一个因为经济社会发展而导致统计指标内涵、口径范围发生变化的例子?
许宪春:比较典型的例子是支出法GDP核算中的固定资产形成总额。2008年之前的国民经济核算国际标准,研究与开发支出是作为中间投入处理的,2008年国际标准才作为固定资本形成处理。作为中间投入处理,就不被纳入GDP;作为固定资产形成处理之后,就被纳入GDP了。
按照现行的国民经济核算国际标准,固定资产形成总额还没有包含数据资本支出。但是,数据资产的重要性已经日益显现,像滴滴出行这样的互联网平台企业,数据资产已经成为它们最重要的资产,它们用于数据收集、存储、开发维护的投入,已经超过用于设备、办公楼采购和维护的投入;一些正在进行数字化转型升级的企业,传统的固定资产投资在萎缩,但在数据资产方面的投资却呈快速增长之势。
我曾带领我的学生调研过11个省份的80多家企业,大都是广东、上海、北京、江苏、浙江等经济发达省份的企业,看到的数字化转型趋势非常明显。虽然专家学者们在GDP核算中对数据资本支出如何进行处理还有不同的主张,但是进入数字经济时代,数据资产在经济发展中的作用在迅速上升是不争的事实,统计理论和方法的研究必须迅速跟上,否则数据资产在经济发展中发挥的重要作用就体现不出来。
目前数据的爆发式增长和数字经济的迅速发展,对政府统计提出了一系列挑战。例如,如何准确估价数据资产的价值及其对经济发展做出的贡献?又如,如何全面客观地测算数字经济增加值?现在许多互联网平台提供大量免费或者价格低廉的服务,包括搜索引擎、导航、微信交流、线上订票,等等,由于是免费的或者是价格低廉的,目前GDP还没有或者没有充分地体现这些活动创造的价值。
再比如互联网平台企业创造了大量的灵活多样的就业方式,包括网约车、外卖骑手等等,这些零工经济就业者与互联网平台企业大都没有签订劳务合同,他们所创造的增加值往往没有或者没有充分体现到GDP中。
本文来自微信公众号:经观书评 (ID:jingguanshuping),作者:张健康