去搜搜
头像
万亿大数据产业链上,最值得投资的3个环节是? | 科技篇
2021-06-02 11:29

万亿大数据产业链上,最值得投资的3个环节是? | 科技篇

文章所属专栏 投资就是选赛道:讲透6大热门赛道
释放双眼,听听看~
00:00 12:22

# 收听音频,一起掘金大数据


2014年,马云提出了一个重要的新观点:“人类正从IT时代走向DT时代。”所谓IT,就是Information Technology,信息科技。所谓DT,就是Data Technology,数据科技。DT是IT的基础上更进一步的技术,通过对数据的收集、分析、处理,更好的服务于每一个人的生活和生产。


大家可以想一想,在二三十年前,获取信息的方式也就是读读书、看看报。一个星期的报纸加起来才有几个字?而在信息化时代,我们每天吃饭、运动、浏览新闻、购买商品、甚至睡眠时,产生的数据都会呈爆炸式增长。


这么多的数据本身其实没有什么用处,但数据里面包含一个很重要的东西,叫做信息。信息会包含很多规律,我们需要把这些规律提取出来,最终应用于实践。大数据分析的最终目的就是挖掘数据背后的价值。


大数据技术其实离我们的生活并不远。最常见的就是电商平台的推荐机制,我们经常会发现,在电商平台上买了A,又被推荐了B,恰好B又是自己想买的,这就是基于大数据带来的用户兴趣预测,非常有助于提升营销效率和用户粘性。再比如2020年疫情期间,百度、众云利用大数据平台优势打造"疫情地图",实现疫情数据实时更新,以及潜在疫情动态监测,这就是大数据技术应用于联防联控的一个体现。


虽然业界对大数据还没有一个统一的定义,但是大家普遍认为,大数据具备 Volume、Velocity、Variety 和 Value 四个特征。


  • 第一个特征是Volume:表示大数据的数据体量巨大。


数据集合的规模已经从 GB 级增加到 TB 级再增加到 PB 级,近年来,数据量甚至开始以 EB 和 ZB 来计数。据国际权威机构Statista的统计和预测,全球的数据量在2020年有望超过50ZB,也就是50万亿GB。举个最直观的例子,百度首页导航每天需要提供的数据超过1-5PB,如果将这些数据打印出来,会超过 5000 亿张 A4 纸。


  • 第二个特征是Velocity:表示大数据的数据产生、处理和分析的速度在持续加快。


业界对大数据的处理能力有一个称谓——“ 1 秒定律”,就是说对处理速度的要求一般是在秒级时间范围内给出分析结果。大数据的快速处理能力充分体现出它与传统的数据处理技术的本质区别,那就是可以从各种类型的数据中快速获得高价值的信息。


  • 第三个特征是Variety:表示大数据的数据类型繁多。


传统 IT 产业产生和处理的数据类型较为单一,大部分是结构化数据。不过,随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。现在的数据类型不再只是格式化数据,更多的是半结构化或者非结构化数据,如 XML、邮件、博客、即时消息、视频、照片、点击流、日志文件等。


  • 第四个特征是Value:表示大数据的数据价值密度低,但整体的价值确在不断提高。


比如在一段一小时的监控视频中,有用的数据可能仅仅只有一两秒,但是却会非常重要。通过对大数据进行处理,找出其中潜在的商业价值,将会产生巨大的商业利润。


在数字经济时代,数据就是一种最重要的生产要素。大数据随之也成为了一个重要的产业。根据中工信部副部长介绍,“十三五”时期,我国大数据产业年均复合增长率超过了30%,2020年产业规模超过了1万亿元。2015年十八届五中全会,大数据产业就已经正式上升为国家战略,并在近五年取得了长足的发展。作为新基建七大领域之一,大数据中心是国家未来重点建设的方向。我国着力发展大数据产业,主要有以下两个原因:


  • 第一,作为人口大国和制造大国,我国数据产生能力巨大,大数据资源极为丰富。


随着数字中国建设的推进,各行业的数据资源采集、应用能力不断提升,将会导致更快更多的数据积累。我国的数据储备量在2020年可能已经突破12.5ZB,占全球总量的近四分之一,成为名列前茅的数据资源大国和全球数据中心。


  • 第二,大数据是一种基础性和战略性资源,是新基建的“地基”。


5G、人工智能、工业互联网等新一代信息技术的发展都离不开对大数据的需求,大数据中心的建立能够助力牢固信息化“地基”建设,可以说是新基建的根本。


大数据产业属于朝阳行业,成长性较高。不过,我国目前大数据领域的企业超3000余家,超70%的大数据企业为10人至100人规模的小型企业。竞争还比较激烈。未来可能脱颖而出的企业有两种类型,一种是掌握海量有效数据的企业,第二种是有强大数据分析能力的企业。


接下来我们就来梳理一下大数据产业链,看看哪些环节相对更有价值。大数据产业链可以分为六个环节,分别是数据源头、数据采集、数据存储、管理平台、数据分析和数据应用。从投资角度来看,其中数据的采集、存储和分析三个步骤是核心。数据源头由于涉及到个人隐私,受政策制约比较严重。大数据的应用在多数行业还处在导入初期,发展还不太成熟。所以我们主要讲下前面三个核心环节。


1、第一个环节是数据采集,这相当于大数据产业链中的“卖水人”。


采集有两种方式,第一个方式是拿,专业点的说法就是爬取。搜索引擎就是这么做的:它把网上所有的信息都下载到它的数据中心,你一搜才能搜出来。在这个过程中可能用到的采集设备是网络探针。第二个方式是推送,很多终端像是摄像头、心率传感器等都可以帮我们收集数据,比如小米手环,可以将你每天跑步的数据,心跳的数据、睡眠的数据都上传到数据中心里面。


数据采集领域市场呈现多寡头垄断局面。国内市场的前四大分别为中新赛克、恒为科技、迪普科技、恒扬数据。其中,中新赛克市场份额较高,为15%。由于采集设备对产品的性能要求高,产品定制化属性带来很强的客户粘性,龙头公司的盈利能力都比较强,中新赛克、迪普科技毛利率能达到70%-80%以上,净利率也都在30%以上。


机构对数据采集的布局并不多。几家龙头公司都只有3-4只公募基金持有,占流通股比在1%-2%左右,并不算高。


2、第二个环节是数据的存储。数据的存储首先少不了服务器。


大数据存储与管理的主要参与者以传统数据库企业为主,国际上主要有 Dell、NetApp、HPE、IBM等,在中高端市场有较强影响力。国内厂商华为一家独大,市占率达到30%,新华三、浪潮信息、海康威视分别占10.9%、6.9%和6.6%


数据存储赛道是公募基金比较看重的赛道之一,对上市龙头企业配置较多。有679只公募基金持有海康威视,占流通股的15.5%,属于绝对的机构重仓股。另外还有21只基金持有浪潮信息,不过规模不大,占流通股只有1.1%。


当数据量很小的时候,用很少的几台机器就能解决问题。但是当数据量越来越大,最牛的服务器都解决不了问题了。这个时候就需要聚合很多台机器的力量,众人拾柴火焰高。这个时候就需要建设数据中心。


数据中心是为集中存放的具备计算能力、存储能力、信息交互能力的IT应用系统提供稳定、可靠运行环境的场所。数据中心按照服务的对象可以分为企业数据中心(EDC)和互联网数据中心(IDC)。EDC服务于企业或机构自身,IDC由服务提供商所有,服务于互联网所有客户。


2019年中国数据中心数量大约有7.4万个,大约能占全球数据中心总量的23%,数据中心机架规模达到227万架,在用IDC数据中心数量2213个。中国电信、中国移动、中国联通具备资源优势,三家基础电信运营商占据着中国IDC市场65%的份额。但是全球来看,还是以第三方IDC服务为主,比如美国的两大巨头EquinixDigital Realty


国内IDC龙头企业包括世纪互联、万国数据、光环新网、鹏博士、宝信软件等。不过这些公司市占率都不高,万国数据市占率4.8%、世纪互联市占率4.5%、光环新网、鹏博士、宝信软件市占率都不到2%。其中,万国数据机柜数量略胜一筹,营收规模和盈利能力也都在板块中领先。


机构对IDC的前景比较看好,布局相对较多。虽然世纪互联和万国数据两个龙头都在美股上市,不在机构重仓股中。A股上市的宝信软件后发制人,业绩增速一直较快,得到了机构的青睐,有51只公募基金持有,占流通股的9.5%。当然,这个配置规模在整个A股市场并不算多,但在大数据产业链上还算是比较多的。


3、第三个环节是数据的分析和挖掘。


存储的数据都是原始数据,很多都是杂乱无序的。因此需要清洗和过滤,得到一些高质量的数据。对于这些数据可以进行分析,从而发现数据之间的相互关系,找到规律。此外,还可以从数据中挖掘一些隐性的知识。比如你要查一个公司的股票,这个时候我们就需要挖掘公司股票背后的高管信息、财务报告等等一系列的隐藏信息。否则如果仅仅搜索出这个公司股票涨的好,于是你就去买了,那很可能就被套牢了。


国际上分析与挖掘领先的公司有PalantirSplunk,Palantir主要和政府合作,打击恐怖分子和犯罪分子。Splunk则是第一家上市的大数据公司,不过现在还在亏损。国内主要参与者包括电子数据取证行业领先的美亚柏科、“大数据+多行业拓展”的东方国信、深耕语义智能的拓尔思等。这些公司盈利能力均较强,毛利率能达到45%-55%左右。


机构对数据挖掘领域虽然也有布局,但目前持仓并不多。有9只公募基金持有美亚柏科,占流通股的7%。另外还有3-4只基金持有东方国信和拓尔思,但规模不大。所以,这个环节的投资价值也还有待进一步挖掘。


最后总结一下,大数据作为数字经济时代最重要的生产要素,能够帮助各行各业的企业从海量数据中挖掘出用户的需求,使数据能够从量变到质变,未来的商业价值是值得期待的。目前大数据产业还处于发展初期,竞争比较激烈,未来有两类企业可能突出重围,一类是有海量数据的企业,另一类是有强大数据处理能力的企业。从大数据产业链来看,整体产业还没有进入成熟期,商业模式也还有待进一步验证,所以目前不算是机构重仓的一个核心赛道,其中只有数据存储环节算是机构相对看好的一个赛道。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声