扫码打开虎嗅APP
本文来自微信公众号:造就(ID:xingshu100),原标题为《直播笔记 |卫星遥感数据告诉你,中国经济恢复的怎么样了?》,题图视觉中国
随着国内疫情趋于好转,各地纷纷降低响应级别。与此同时,国外的疫情正处于爆发阶段,美股十天内四次熔断,在关注疫情发展的同时,经济的恢复也不容轻视。微众银行揽月平台利用卫星遥感数据对中国的经济恢复情况进行深入研究(本次研究的数据截止于3月9日),中国各个行业的复工情况如何?疫情对未来几个月又将产生何种影响?
吴海山
微众银行副总经理
数据科学50人成员
以往我们做投资研究、金融分析,用的最多的是一些传统数据,比如CPI、利率、PMI指数等,缺点在于,可能每个月才会更新一次,对我们来讲非常低频。
而另类数据可以让我们用一个新的手段,看到经济的运转或者企业状况。这些数据本身的数量非常大,比如智能手机上的定位数据、支付数据,能够帮助我们看到线下商场的消费,餐饮履约进展。
5G到来,物联网会变得会越来越普及,而5G和物联网的数据将帮助我们去监测经济的运转,城市的变化。如果未来无人车普及,那么,在大街上跑的就不是几百万辆车,这意味着将会有几百万个眼睛,帮我们“看到”这个城市的变化,比如海底捞前面有没有人排队,星巴克前面有几个人在买咖啡等。
那么如何利用另类数据来分析经济?当下中国经济恢复情况如何?卫星遥感数据在其中又发挥了哪些作用?
1、卫星发射已经不是一件“昂贵”的事情
目前,卫星的大小、成本、体积和发射的价格越来越低,这让我们使用卫星数据成为了可能。左图是目前几个卫星体积的大小,最右边的美国的Digital Globe公司制造的卫星叫Worldview,它有几吨重,造价也非常贵。但是它的图片分辨率非常高。
卫星体积的变化
Plant Labs公司发射的卫星叫鸽子卫星,大概就像右边这个图这么大,我们一个手就能拿起来,而且它的发展成本也比较低。
如果卫星非常贵的话,每次只能发射一颗或者两颗,它对地球的观测频度也会大大的降低。现在卫星的成本降得非常低,可以实现对地球非常高频的观测。比如像Plant Labs已经有300多颗卫星,它几乎可以实现“天级别”的数据更新。
很久以前,摩托罗拉有一个铱星计划,想把很多卫星发射到天上去,组建一个全球不间断的通讯网络。不论你是在家里,还是在深山,甚至是大海里都可以使用网络。但是这个计划在当时可能太过雄伟,以至于它花了太多的经费,最后没有成功。但铱星计划这个公司活了下来,而且现在已经开始盈利。
从铱星计划到Starlink
当下最引人注目的是Starlink公司,它每次可以将上百颗卫星发射到太空。右边这张图是他们一次性发射了大概60颗卫星,就像在太空中的一辆班车一样。而这些卫星数据会变得越来越普及,随着中国和美国科技的发展,太空之争几乎变成了中美竞争。
各国发射成功数量对比
这张图来自于《经济学人》,从1957年冷战开始,一直到2018年,美国、中国以及俄罗斯(前苏联)向太空发射数量的变化。大家可以清晰地看到,在冷战期间基本上是美国和苏联主导。但到最近,尤其在2018年,中国发射的数量增长非常快。现在太空卫星发射已经变成了中美之间的竞争。
2、卫星数据隐含了哪些信息?
卫星发射之后,我们怎样获取数据分析呢?左边是一颗遥感的卫星,可以通过不同光谱的传感器捕捉到成像。右边的图片就是不同的通道和光谱拍摄到的卫星图片。
最下面是热红外成像,如果这个区域的温度比较高,那么发光亮度就比较大,它可以帮助我们观测这个区域的经济发展。中间的图叫雷达合成孔径图像,这个图像的意义是什么?如果卫星拍一个图片,这个地方有很多云或者雾是拍不清楚的,但雷达合成孔径可以通过另一个波段绕过云层拍摄地面状况。这张图就是雷达合成孔径对卫星拍摄下的储油罐。
另外一个就是我们经常说的彩色通道,它对不同的可见光会有反应,可以看到人眼能看到一些图片信息。不同的类型的卫星能够拍摄到不同类型的图像,分析的价值和意义也是不一样的。
数据使用在多领域
目前,通过这种另类数据做金融分析在国外非常常见。这张图展示的是美国的创业公司里,从事遥感卫星图像分析、采集和卫星发射的相关公司,它们的数据已经用在了非常多领域。
我们可以通过卫星来观测——
沃尔玛停车场的停车数量,分析消费的变化;
可以看房地产的进展;
生产制造行业的进展和变化;
港口货轮数量的变化,推测贸易状况。
但卫星数据分析起来非常难,因为卫星图像的分辨率比较高,量非常大,所以分析的门槛也比较高。它需要有非常强的人工智能来分析这些数据。而这种数据的好处之一是能够相对客观、实时地帮我们判断经济发展。
另类数据的应用
● 公司经济活动跟踪
通过卫星,我们可以监测公司经济的运转,比如图一是某个大型商超,我们可以来观察这个区域的停车数量变化,进而观察客流的变化,从而判断经济运转效果。
● 原油储量跟踪
在期货中,也可以利用卫星数据来监测分析。原油期货的存储和供给是非常重要的两个指标,我们可以通过AI算法自动识别这块区域的储油罐的面积和大小,然后再根据阴影面积的大小估算每一个油罐的储油量。通过这种方式,我们可以评估全国范围内,甚至是全世界范围内的原油储量。这个信息在原油期货交易中,可以作为一个非常好的指标使用。
● 机场流量跟踪
疫情对机场交通的影响非常大。我们可以通过卫星图像分析、监测飞机数量变化,评估各种事件对机场或周边其他机场的影响。
● 农作物产量预测及期货应用
同时也可以对农业产量进行预测,图五是我们团队通过AI算法自动识别不同类型的农作物,包含玉米,大豆,水稻等,再通过算法预测不同农作物区域的产量。这不仅对农业的应用有非常大价值,对农业期货交易也有非常好的参考价值。
● 新能源发展指数
随着气候变化,新能源已经变得越来越重要。其中最重要的发展方向之一就是太阳能光伏电站的发展。我们可以通过卫星图像、算法、自动识别中国所有的光伏电站,评估线下光伏电站安装的进展和整个光伏产业的变化。
2018年,光伏产业有个531新政,国家取消了对新能源的一些补贴,这会对光伏太阳能电带来哪些影响?通过卫星数据就可以做一个非常好的评估。
● 区域经济活力监测
中国有句俗话“想致富先修路”,我们通过监测不同区域的路网,就可以来评估这个区域的经济发展活力。
● 企业风险地图
最后一个应用在企业风险和保险行业。这是我们选取的一个真实案例,2019年的台风从浙江登陆一直到山东。桔黄色的区域是我们通过算法监测到的受到台风影响的大棚区域变化,这对保险公司核保定损有非常大的参考价值。
3、后“疫情时期”,中国经济恢复状况
通过对另类数据的分析,我们有四个方面的重要发现。
来源:微众银行
第一,我们用另类数据构建了一个指数——“中国经济恢复指数”(CERI),通过聚合的出行数据,评估中国目前经济恢复的进展状况。最新的CERI指数已经更新到2020年3月9日,它显示中国目前72%的经济已经开始恢复好转,沿海城市恢复的程度比内陆城市好。
第二,在疫情期间,线上行业的变化是翻天覆地的。线下行业受到疫情的影响比较小,但是线上行业增长非常迅猛,可以通过线上的舆情数据来评估线上行业的变化。
美国Zoom公司,主要提供在线会议服务,从疫情开始,他们的股票增长非常迅猛。我们把诸如钉钉、企业微信、腾讯会议、Zoom等在线办公行业综合起来做了一个线上办公指数,在疫情期间,他们的增长速度是537%。
在线教育也是增长最快的行业之一,同比增长幅度大概是在169%,在线游戏的增长速度是124%,在线视频的增长是63%。我们针对这四个行业的上市公司做了一些关联,发现它们的股票增长幅度基本上和我们指数的增长幅度非常吻合。
第三,通过卫星数据监测分析中国的制造业发展,我们构造了一个指数——基于卫星的生产制造指数(SMI)。最新的结果显示,钢铁行业在二月中旬已经恢复到了80%,恢复的程度是非常好的。
另外,通过人工智能算法可以监测不同区域的车辆数,从而判断这个区域的复工变化。比如说特斯拉,我们发现特斯拉的工厂停车场的数量在2月10日已经完全停满,这意味着这个区域的复工的速度基本上在二月初就达到了100%。而疫情对于旅游业的影响非常大,比如上海迪士尼乐园,基本上没有一辆车,这也印证了它目前还没有营业的状况。
第四,通过AI算法建立预测模型,分析整个中国的疫情后续的走势。我们构建了几个模型,结果显示,在三月底疫情对经济的影响基本上都可以恢复。
中国经济恢复状况
2019、2020中国经济恢复指数对比
这张图是2020年和2019年中国经济恢复指数的变化,我们分析了中国每个城市复工的CERI的指数变化,根据城市GDP的大小加权做了处理,构建了整个中国的经济恢复指数。
2019年,整个经济在过年之后的第一周,恢复度都已经达到80%左右,从第二周开始(也就是元宵节之后),经济复苏程度达到100%。
2020年,由于疫情的影响,从初一开始都慢慢往下滑。有些旅游城市,比如三亚,年前有很多人去旅游,但是封城是在1月23日、24日决定的,很多出去旅游的人开始返回。整个旅游业行业的变化也在指数里面反映了出来,中国经济恢复指数反映的是整个中国经济消费和制造两个板块的综合评估结果。
2020年,2月8日、9日左右,整个结果是最低的。但从2月9日复工后,慢慢有所增长。最新结果显示,3月9日,中国的经济恢复指数达到了72.2%,但不同城市的结果差别非常大。
各省份复工程度对比
这张图上,颜色越深代表区域的复工程度越好。从2月8日到3月9日,沿海包括很多内陆城市(除武汉外),恢复程度都非常不错。
生产制造业恢复情况
我们可以通过卫星图像观察生产、制造业的行业变化,我们定义了一个卫星生产指数,它通过卫星数据分析生产、制造业的变化和进展。
以钢铁制造业为例,如何通过卫星图像进行观察呢?钢厂炼钢,高炉的温度非常高,它会释放短波红外辐射。我们用欧洲的Sentinel哨兵卫星能够捕捉短波红外,就可以看到这个区域的变化。图中红色的点就是钢厂的高温区域。
卫星捕捉到的短波红外
我们通过人工智能算法自动识别这些区域,构建了一个能够衡量钢铁产业复工进展的变化。我们把2019年9月、10月、11月、12月做了一个回测,看一下分析的钢铁行业SMI值与平常看到的宏观数字的关联性是什么。对比了两个行业数字,第一个,蓝色的叫工业增加值,红色线条是我们计算的SMI,基本上它的趋势是非常吻合的。
钢铁产业复工进展的变化
第二个对比的是PMI,即通过对采购经理的月度调查汇总出来的指数反映经济的变化趋势。比如PMI是50,就代表它是增长的。整体来说,我们的SMI与PMI在去年几个月中的表现是比较吻合的,但是在11月,12月不太一样。
整个钢铁行业受到的影响并不是很大,我们也通过其他的手段佐证了这个事实。
宝钢停车场对比图
比如这个是上海宝钢的停车场,左边是2019年4月份的,右边是2020年2月10日的画面。通过AI的算法识别停车场中车的数量,我们发现这个区域在2019年正常工作日的时候,大约是1000多辆车。在2020年2月10日大概有600多辆车,整体的恢复指数在60%左右。而红外卫星图像的发展变化在70%左右,基本比较吻合。
上海特斯拉工厂停车场
另一个比较大的公司——特斯拉。我们分析了上海特斯拉工厂的员工停车区域,观测特斯拉员工的停车场数量变化。在疫情期间,1月31日大概只有18辆车。但是到2020年2月10日复工的时候,停车场大概有100多辆车,这块区域的整体复工率几乎是接近百分之百。对比官方以及网上的报道,整体情况比较吻合,特斯拉恢复的进展比较好。
线上行业变化
线上行业增长变化
我们通过网上的舆情信息,观察线上行业的变化。
以2020年1月1日为起点,在线办公从二月初就开始有非常高幅度的增长,这也非常符合Zoom公司股票的增长幅度。同时这个指数里面也包括了腾讯会议、钉钉、企业微信等,在全行业里,在线办公的增长幅度是最高的。在线教育领域,我们把新东方、好未来等公司做了一个评估,整个行业有非常高的增长,平均在169%,将近两倍。
出乎意料的是整体电商行业,在疫情期间几乎没有什么大的变化,而快递行业有一个小幅下滑。我们把数据与不同行业的公司股价走势做了对比,比较吻合。
疫情的影响会持续多久?
疫情性对经济的影响会持续到什么时候呢?
线上舆论指数
疫情的消除与恢复不能一概而论,通过社交媒体的舆情数据,我们把网上有多少人还在讨论肺炎、病毒、新冠的数字做了一个指数。可以看到一月初,媒体开始报道新冠病毒,往后处于沉寂的状态。直到1月20日左右,有一个高爆发的增长,1月24日达到最高峰。在这期间每天都保持一个高状态。随着国家开始采取有效的管控措施后,在线讨论疫情的频度和指数开始有了明显的下滑趋势。
我们根据下滑的趋势做了一个简单的预测模型,预计在4月2日可以接近正常状态。但是这个结果不一定完全准确。因为从三月初开始,下滑的幅度已经有了一个非线性的变化。原因之一就是疫情演变成了一个国际性话题,西班牙、意大利、韩国等国家也出现了很多患者,大家不可避免的在网上会讨论这些国家的疫情变化。
出行指数
另外两个预测也验证了我们的结果,第一个是基于出行指数,1月24日开始一直下滑,2月8日达到最低点,然后随着复工的变化,整体开始缓慢上升。预测的结果大概是在3月28日左右。
中国经济恢复指数
第二是基于中国经济恢复指数,预测的结果也是在3月26日左右,与3月28日比较接近。三个模型综合起来,我们认为三月底左右,整体经济和大家的生活基本可以恢复正常(除武汉外)。
我们非常期待,结果与我们预测的一样。