扫码打开虎嗅APP
随着全球数字经济进入蓬勃发展时期,数据已成为全新的资产和新的关键生产要素。加快推进数据价值化、发展数据要素市场是数字经济发展的关键。我国在2022年12月出台《数据二十条》,2023年3月国家数据局成立,顶层文件+管理机构落地,数据要素进入加速落地阶段。
那么,将数据进行要素化和以前对待数据资源的方式有何不同?数据要素在AI和数字经济产业链上的价值如何?产业链上哪些环节的价值量更高?企业的竞争壁垒有哪些?哪些行业使用数据产品的市场空间更大?妙投邀请数据要素领域资深专家为我们解读。预计本篇阅读时间10分钟,有深度思考的你们都棒棒哒☆
核心看点:
数据要素化,更加强调数据在更广范围、更大规模地市场化交易流通和融合应用。
从落地层面看,制约数据市场化交易的关键是数据流通与安全的矛盾。
数据要素产业链上的传统的云、网设施,虽然市场需求呈平稳上升趋势,但处于红海市场。
云行业处于龙头企业战略亏损阶段,运营商的核心优势是数据资源和央企身份。
网络设施方面,三大运营商形成通信网络运营垄断优势,以华为为代表的网络设备供应商具备核心技术优势。
数据要素设施方面,大型央企如中国电子、中国移动等具备身份优势,和地方政府合作基础更好,作为相关设施的建设单位,更易承接政府项目。
数据要素产业链上,数据采集、加工环节价值量更高。电信运营商、电商平台企业都是典型的数据垄断型企业。加工环节,对规模化、智能化数据处理和分析技术要求较高。
Q:把数据进行要素化后,和以前对待数据资源的方式有何不同?为何这样做?
A:数据资源阶段,也就是2019年以前,更加聚焦于数据的采集、汇聚、加工、治理,在流通和应用方面主要聚焦于政府内部各部门的数据共享,支撑政府部门履职(城市治理、基础民生服务)等领域。企业数据的采集、汇聚、治理后,主要用于支撑垂直线条的业务,核心是推进数据规模化治理,形成大规模、高质量的数据资源,热点技术是面向数据处理和分析类技术,如数据库+流计算+批量计算+元数据管理+数据挖掘+BI工具等。
2019年,党的十九届四中全会首次将数据与土地、劳动力、资本、技术、并列作为重要的生产要素。到了数据要素化阶段,更加强调数据在更广范围、更大规模地市场化交易流通和融合应用。
市场化交易流通。可以把数据要素作为商品,同传统商品相同,在流通前需要进行权属确认(即原始数据的产生、治理到加工为产品过程中各主体合法享有的权益)、估值(对数据要素价值进行货币化计量,作为指导市场定价的依据)等必要前置环节。
当前全国在探索数据要素的确权、估值、定价。数据要素市场化流通后,可在政府与企业之间、企业与企业之间自由买卖,不再仅限于在企业内部或政府各部门之间的共享流通(基于内部系统打通,实现数据交换)。
政府掌握很多高价值数据,以卫健委为例,它管理很多医院,医院拥有患者的临床数据,这些数据对于药企更有效地进行药品研发不可或缺。如果数据要素能够在政府与企业之间市场化流通,即为药企合法合规购买临床数据提供了渠道,当然,从法律上,购买后的临床数据仅仅只能用于药品研发,并保证使用期间不能泄露患者隐私。
融合应用。数据融合应用对于城市治理、企业生产及公共服务具有巨大价值,以公共服务领域的“一网通办”为例,现在百姓办事可以“一窗受理、一次办结”,无须再跑各部门,背后是各部门间数据的流通。
当前各地都在培育数据要素交易市场,推动数据在政府、企业以及个人之间的广泛流通,从落地层面看,制约数据市场化交易的关键是数据流通与安全的矛盾。
数据流通与安全矛盾,即数据的关键信息隐藏,则可以确保隐私不泄露,但是价值无法得到释放,原始数据敏感信息全部呈现给需求方,则隐私得不到保护。举个例子,从某个人的生活习惯或行为轨迹,可以挖掘到商机比如近期贷款需求,但是把他的关键信息隐藏后,无法知道这个人是谁,没有办法精准匹配到他。
目前,支撑数据可信流通的技术热点是区块链+隐私计算+数据脱敏+身份认证。这样的技术组合有望解决安全问题,但从落地来看,现在尚处于加快探索和优化的阶段。
区块链。区块链在数据流通中最核心的是,对参与主体的行为进行存证和记录,从而能够让监管方(如政府)对数据流通的全过程进行监管。比如参与者何时接收数据、如何使用数据、用途等所有行为都会清晰地留痕,且不可篡改。如果事后数据隐私泄露,监管方即可以追究责任。区块链技术是这个组合里相对更成熟的,但只能对行为进行跟踪记录,不能解决脱敏之后数据的价值降低等问题。后面会提到。
隐私计算。隐私计算有很多技术路线,典型的像联邦学习、多方安全计算等,由于原始数据掌握在多个参与方的手里,隐私计算技术的本质是确保原始数据不出域(即其他参与方无法获得),通过训练得到数据模型,从而实现多方数据的有效融合。这是能够解决数据流通过程中隐私保护的技术路线,但目前其成本、性能问题还没有完全被解决,对大规模数据进行隐私计算,对算力、网络传输性能的要求很高,会造成效率降低,目前还难以推广落地。
数据脱敏。比如,一个信息按照二进制存储,把中间的敏感信息的二进制字段覆盖掉,需求方只能拿到其余字段。数据脱敏技术有局限,数据脱敏后数据的价值降低,也就是前面提到的数据流通与安全的矛盾。
身份认证。个人或企业可以授权特定的个体去使用数据,访问系统之前要进行身份认证,身份认证包含很多技术,比如指纹等生物识别,确保是被授权主体进行访问,从而实现数据的合规利用。
Q:如何给数据要素估值、定价?
理论上,有三种主流方法。
1)成本法。从原始数据采集到存储、加工等各环节都需要设备支撑,根据消耗多少成本进行定价。这个方法有局限性,就是存放很久的数据,消耗了大量算力资源,但不一定有很大价值。存在估值很高,实际价值很低的矛盾。
2)收益法。一些数据对于购买方具有很大价值。比如前面提到的患者的临床数据,包括病理图片等,对药品研发有很大支撑。但具体的收益难以量化,且同样的数据在不同的使用场景下带来的实际价值完全不同,数据价值存在时效性(例如有些个人轨迹的追溯数据的价值会随着时间推移而降低),所以收益法目前尚无统一的计算标准。
3)实际中买卖双方都认可的价格。这是目前市场上可以实践落地的方法。政府正在规范指导定价,基于价值计量制定价格。就像粮食等大宗商品,不是买卖双方随意定价,而是参考政府指导价,具体的指导定价标准仍然在探索中。
Q:如何对包含隐私的数据进行处理?
所有原始数据都不会被需求方直接拿到,需求方拿到的是加工后的数据集,或是原始数据分析后的结果。比如,银行对申请贷款的企业有评级标准,提供贷款给符合放贷标准的企业,但是不会获得企业的产品销路或具体的经营数据。
Q:相较于算力和算法,数据要素在AI和数字经济产业链上的价值如何?
个人理解,数据要素必须通过算力和算法服务才能实现价值化利用,目前就数据要素产业尚无明确的官方定义和范围,但属于数字经济核心产业一部分,数据要素相关产业包含数据商、第三方服务机构(如数据资产评估、法律机构、数据经纪人等)。按照产业链维度,数据要素位于AI产业链的上游,作为原始生产材料。
Q:数据要素产业链上的基础设施的前景和发展趋势如何?企业有哪些关键的竞争力?
A:目前数据要素产业的范围尚未完全形成共识,部分智库如国家信息中心等进行过基础梳理。
我们这样划分数据要素产业链:
上游主要是数据提供方,提供公共数据、业务信息、个人信息的数据。
中游主要是数据服务商、数据交易所,负责采集、处理、加工、分析数据等。
下游是数据需求方,包括政府、金融、教育、医疗等行业客户。
数据基础设施包含存储设施(云)、传输设施(网)、流通设施(可信流通平台、数据产品加工平台、数据登记平台等),这些平台将为以后构建数据交易所提供技术支撑。
其中,可信流通平台,是在供需双方交易对接时,通过区块链、隐私计算等技术,保障数据从供应方流通到需求方全过程的安全。
数据产品加工平台。比如中国电子,在政府授权下,将原始数据加工成数据元件(对数据进行封装或者隐私保护),再把数据元件卖给数据产品加工商去开发数据产品,相当于通过中间处理解决安全问题,也还在探索迭代。这是中国电子的一个独特路径,其他很多地方是没有这个环节的,他们是从原始数据直接到数据产品。当然,企业进行数据安全保护的路径各有不同。
数据元件的核心是,对大规模、高价值的数据进行脱敏处理和中间合规审查,从技术和机制上都确保加工出来的数据元件不存在法律风险。如果产品加工方在使用数据元件加工成数据产品的过程中发生数据泄露,产品加工方或使用方是没有责任的。数据元件相当于一个双向的风险隔离,一是确保原始数据不泄露,二是让产品加工方和使用方在使用过程中没有合规的风险,因为在元件加工过程中有数据合规审查。
对于传统的云、网设施,虽然市场需求呈平稳上升趋势,但处于红海市场。
具体而言,如:
1)云行业,处于龙头企业战略亏损阶段,竞争激烈,大厂商加大资源投入,力求拓展市场份额,玩家主要是被称作“七朵云”的华为、阿里、百度、腾讯及三大运营商。运营商的核心优势是数据资源和央企身份。
就云服务而言,中国移动在三大运营商中更具优势,因为它有更充裕的资金投入到云业务的研发和运营,即便项目一直在亏损。现在的目的不是赚钱,而是通过在此阶段布局来占领市场。
华为、阿里、百度、腾讯等科技企业的优势主要是产品技术和性能。其他企业,如中国电子、中国电科等处于业务起步阶段,加速核心产品打磨和市场拓展,核心比拼的是资源投入能力。
这是因为,一方面,前期研发成本高,主要是人力成本。另一方面,项目不太盈利。很多项目需要建设方投资去建设,需求方购买服务,价格战激烈。比如,中国电子的电子云更多服务于政府,部分服务于行业。承接政府项目的盈利有限,因为企业要需要投资建设,赚取政府购买云服务的服务费。但在这领域没有任何厂家能够垄断,有点打价格战的态势(多年市场份额位居第一的阿里云近期服务大降价)。服务费不高,但运营成本很高。
中国电子、中国电科都有自己的芯片和操作系统,主打安全(防止进口断供或窃取数据),但前者的技术更领先。在提供云服务的同时,也能将自己的芯片、操作系统一并销售。
2)网络设施方面,三大运营商形成通信网络运营垄断优势,以华为为代表的网络设备供应商具备核心技术优势。
3)数据要素设施方面,大型央企如中国电子、中国移动等具备身份优势,和地方政府合作基础更好,作为相关设施的建设单位,更容易承接政府项目。
不过,三大运营商如果真的做数据交易,目前个人理解是,它们可能不具有什么优势,现在央企中真正全方位布局数据交易的或者数据要素配置化改革的只有中国电子一家,而这不是三大运营商战略布局上的重点。因为虽然数据要素的市场很大,但数据要素的产业赛道不一定很大,前景规模不太好预测,一定不及云业务的市场前景。
互联网企业及科技公司更多作为技术支撑单位,与大型央企是竞合关系,市场处于孕育阶段,但总量不会很大(国家政策强调集约化建设),重点关注数据交易流通平台、数据登记平台、数据产品加工平台等。
Q:数据确权的重要性如何?如何进行数据确权?
数据确权是数据流通交易的前提,“数据二十条”提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架。
目前城市侧以产权登记为路径,通过登记来规范各参与方权属,以登记信息为准,作为权属保护和收益分配的依据。
Q:在数据要素产业链中游的采集、加工、存储、交易环节中,哪些环节的价值量更高?企业的竞争壁垒有哪些?
个人理解,数据采集、加工环节价值量更高,因为大量行业数据只有龙头企业才能采集,电信运营商、电商平台企业都是典型的数据垄断型企业。
加工环节,对规模化、智能化数据处理和分析技术要求较高,如阿里的数据中台具有技术领先的优势。
存储方面,由于“党管数据”的要求,因此在核心、重要(如涉及国家安全、重大公共利益等)数据的存储方面国央企具备一定优势,众多央企在技术没有优势的情况下,依然可以切入政务云等行业赛道。
Q:数据要素产业链下游的各行业如政务、公安、医疗、金融、企业级管理等,哪些行业率先使用数据产品?哪些行业的数据产品的市场空间更大?
目前从交易机构的数据产品类型来看,预计在金融领域率先展开探索。
一方面是金融行业信息化程度较高,数据资源丰富,使用场景广泛,如聚焦企业借贷场景,可以通过数据授权方式,由银行对企业经营或用电数据(反应生产情况)进行核验,从而发放贷款。
公安、医疗数据涉及个人敏感信息,目前以数据产品交易的方式流通较少。政务数据前期已经通过开放形式,得到一部分开发应用。
个人认为,金融、交通、医疗等涉及公共服务、商业服务的数据产品空间更为广泛,使用场景更多,当然这要在行业数据隐私安全问题充分解决的前提下。
Q:数据要素产业链各环节形成业绩还需要多久?
个人理解,随着数据要素市场化配置改革加快,围绕数据交易的配套服务,数据资产评估、数据合规认证、数据托管等领域有望最早在“十四五”末期度过探索期,目前不少企业已经提前布局,预计2025年-2030年形成业绩。
Q:数据要素在落地过程中主要有哪些难点?您对于落地进展怎么看?
一是数据要素具有可复制性、非排他性、非消耗性,因此面临流通安全矛盾。这一矛盾不解决,无法建立流通交易市场。
二是数据要素确权、估值、定价、收益分配等机制尚不成熟,各地交易所运行模式尚不成熟。比如,前期很多已经建立的交易所运转不下去,原因是数据的权属不清晰,或者此前立场或退场机制没有提出过,导致很多数据产品都是低价值的,无法界定数据的价格。
三是数据要素围绕交易流通的配套生态尚不成熟,数据公证、数据保险、数据托管、资产评估等第三方专业服务机构尚需培育。
落地方面,预计2025年以前,都将处于探索期,2030年以前有望形成一定规模。
Q:数据局还需要多久完成组建?
国家数据局是本轮2023年机构改革提出最新组建的副部级单位,预计2025年以前可以完成组织架构搭建,清晰职能定位,正式运转。
Q:数据税和数据财政的前景如何?
目前看,各地政府土地财政难以为继,有着强烈的摆脱单纯依赖土地财政的诉求,对数据财政有一定的兴趣,但是真正落地前景尚不明确,至少需要等数据要素市场运转成熟,数据交易达到一定规模才具备条件进行顶层设计,未来数据交易市场交易模式较大可能参考证券交易市场的挂牌交易。
有一组数据,2021年我国数据交易规模超500亿元,其中以数据交易所/中心为主导的场内交易占比2%,由企业等主导的场外交易占比98%,预计2025年整体市场规模将超2200亿元,场外仍占主导,因此数据税和数据财政未来更可能作为政府财政的补充,个人理解,无法取代土地财政。