扫码打开虎嗅APP
本文来自微信公众号:中国工程院院刊 (ID:CAE-Engineering),作者:陈晓红、许冠英、徐雪松、田志平、霍杨杰、易国栋,原文标题:《我国算力服务体系构建及路径研究丨中国工程科学》,题图来自:视觉中国
算力服务是数字中国建设的重要基础和支撑,是提升国家数字化能力和核心竞争力的关键因素。在数字中国背景下,算力服务体系需要适应不同领域、层次和场景的算力需求,实现算力资源的合理配置和高效利用,引领数字经济的发展和创新。
中国工程院陈晓红院士研究团队在中国工程院院刊《中国工程科学》2023年第6期发表《我国算力服务体系构建及路径研究》一文。文章基于全球视角和我国现状,厘清算力服务的内涵,剖析我国算力服务发展中存在的痛点问题,从算力服务形态基础、演进模型、顶层设计3个方面提出我国算力服务体系建设的总体架构,全面阐述我国算力服务体系重点战略和发展路径。
一、前言
在信息技术飞速发展的背景下,数字经济正在成为全球经济增长的新引擎,而数字化转型已经成为各个国家加快发展的重要战略。为此,我国提出了数字中国战略,旨在全面推进数字化转型,实现数字经济高质量发展。数字中国战略作为推动数字经济高质量发展的重要举措,已被写入《数字中国建设整体布局规划》《关于加强数字政府建设的指导意见》等政府文件中。然而,数字化转型的关键在于建立强大的数字基础设施,特别是要满足数字经济对算力的需求。
算力是数字中国建设的基础性、战略性资源,作为数字经济的核心生产要素,已成为推动科技进步、促进经济社会发展的重要驱动力。数字经济的高速增长对应云计算、大数据、人工智能(AI)等新技术的旺盛需求,而这些技术又极度依赖高效算力的支持。《数字中国发展报告(2022年)》预测,未来几年,随着数字化应用的持续深入,我国数字经济对数据中心和云计算中心的需求增速可能高达每年50%以上。
因此,在数字中国战略的指导下,我国加快推进算力服务体系建设,以支持数字经济的高速发展和城市数字化转型升级。到2025年,我国将建成具有全球竞争力和支撑能力的国家级算力基础设施,为数字化转型提供强大动力。
尽管我国正加速算力基础设施建设,但从整体来看,当前算力服务供给仍显不足,多种挑战亟待解决。因此,如何进一步提升算力服务能力,使其与数字经济发展需求相匹配,是我国当前面临的重大问题。
具体来看,《中国算力发展指数白皮书(2022年)》显示,我国整体算力供给能力较前一年仅增长25%,且主要集中在东部沿海地区。与此同时,以云计算、大数据、区块链等信息技术为基础的数字经济对算力的需求增速达到了30%以上,这表明我国正面临较大的算力缺口。
我国数据中心还存在大量的闲置资源,平均利用率只有38%,远低于全球水平的60%和欧美发达国家的65%。这种极为突出的矛盾现象反映了我国算力市场存在不完善和不规范,以及算力资源分布不均和配置不合理等问题。
此外,从技术上看,我国仍高度依赖进口算力设备,核心关键技术受制于人,尤其在计算机芯片、软硬件系统方面仍然与西方发达国家差距明显,这些都严重制约了算力服务质量和效率。
为此,文章从算力服务的内在含义、当前国内算力需求和供给情况、算力服务体系构建所面临的挑战和问题等方面入手,探讨了数字中国背景下我国算力服务体系发展的重要性。
研究指出,尽管我国算力服务体系建设已经取得了积极成效,但是在建设过程中仍然存在众多挑战和问题,如资源分布不均、技术标准不统一、算力与场景匹配困难、供应链竞争激烈等。
因此,进一步优化算力服务能力,释放算力创新动能,推进数字中国战略实施,提供高效、安全、可靠的算力服务,成为下阶段我国算力服务发展的重中之重。
二、算力服务的内涵及意义
(一)算力服务是数字经济和智慧城市的核心底座
算力服务是全国一体化算力网建设的重要组成部分,对于提升国家数字化、智能化和可持续发展水平具有重要意义。据《2022—2023全球计算力指数评估报告》统计,2022年我国跨机房、跨地区的并网算力规模较2021年增长了40%,体现了算力服务在推动资源共享方面的重要作用。
算力服务有助于企业和城市实现智能化、高效化和可持续发展,提升社会、经济和环境效益。针对重点行业和领域开展的算力提质增效工程显示,算力服务平台可帮助企业提升生产效率15%以上,节约能源可达10%以上。为推动算力服务的发展,政府应该通过政策引导手段鼓励存量算力资源并网,并出台专项激励政策以加速新增算力资源整合和调度,为智慧算网的建设提供有力保障。
(二)算力服务是科技革新和产业升级的生命源泉
随着技术的不断进步和应用的深入发展,算力服务已经从一个技术概念变成了一个产业现实。中国算力大会上的最新数据显示,2022年我国算力核心产业规模达到1.8万亿元。算力服务作为科技革新和产业升级的生命源泉,已经成为产业数字化转型和升级的重要助推器,无论是在制造业、金融业、医疗健康、教育文化,还是交通物流、农业生态、公共安全、智慧城市等领域,都可以通过算力服务实现数据驱动的创新和优化。
中国智慧农业发展研究报告显示,利用算力服务平台,工业制造企业单位产品生产成本可降低12%以上,农业生产力可提高25%以上。算力服务能够提供强大的数据处理和分析能力,使企业能够更快速地响应市场变化,提高工作效率和产品质量,满足客户需求。
同时,算力服务也是建设具有中国特色自主创新体系的重要基础。在当前国际形势下,掌握科技创新主动权,实现独立自主、创新型国家战略目标,对于国家发展至关重要。
因此,算力服务建设需要持续不断地进行技术创新和发展,以满足日益增长的数据需求和多元化应用场景,为推动我国产业升级和科技革新发挥更大作用。
(三)算力服务是自主研发和技术攻关的战略高地
算力服务是我国产品研发和技术攻关的战略高地,也是实现国家战略需求的重要手段。面对技术封锁和竞争压力,努力走出一条符合中国国情的创新融合发展新路,集聚力量进行原创性、引领性科技攻关。在数字中国的大时代背景下,算力服务的建设更加迫切,它不仅能够满足全国各行各业的算力需求,而且能够推动我国在全球新型网络技术的焦点上发挥引领作用。
然而,当前我国算力服务的发展还面临着诸多挑战,其中最突出的就是过度依赖高端网络技术,这不利于我国算力服务的安全、高效和可持续发展。据统计,目前我国90%以上的关键网络设备和技术来自国外,这给国家战略安全带来隐患。
因此,我国迫切需要自主研发算力网络核心技术,构建具有自主知识产权和国际竞争力的算力网络体系。尽管算力网络的技术路径和标准化工作还处于探索阶段,但发展自主可控的算力网络已势在必行。我国应抓住关键核心技术,加快推进算力网络建设,提前谋划布局,抢占新一轮技术竞争中的制高点。只有这样,才能够在数字化时代保持我国算力服务的领先地位,为科技创新和数字经济发展提供强大支撑。
(四)算力服务是国家能力和民生福祉的强劲保障
算力服务是一项新兴的互联网基础设施,它通过提供高效、灵活、可靠的数据处理能力,为国家经济社会发展和民生福祉提供了强大的技术支撑。算力服务不仅可以优化算力资源的配置和利用,还可以结合云计算、大数据、AI等技术,为政府、企业和个人提供多样化的服务和解决方案。
据《数字政府云原生基础设施白皮书》统计,基于算力服务的政务云平台已覆盖超过80%的省(市)政府部门,提升行政效率超过50%。算力服务在产业升级、科技创新、社会治理等方面发挥了重要作用,推动了社会各个领域的高质量发展。
同时,算力服务也为民众的生活带来了便利和改善。例如,通过智能家居和智慧城市等领域的应用,算力服务可以帮助人们实现对家庭和城市的智能化管理;通过医疗、金融、教育等领域的应用,算力服务可以帮助人们享受到更高水平的服务和更好的生活品质。总之,算力服务已经成为国家信息化建设、经济转型升级和民生福祉的强劲保障。
三、我国算力服务的发展瓶颈
(一)算力供需矛盾愈发突出
在第五代移动通信(5G)网络和边缘计算终端规模化建设的推动下,智联终端呈现出多元化的发展势头,为各类应用提供了更强大的本地算力。工业互联网、自动驾驶、数字孪生、元宇宙等新兴应用对数据处理的时效性和安全性有了更高要求,从图像识别到自然语言处理,从机器学习到深度学习,AI应用场景越来越多,模型的复杂度越来越高,对算力的需求也越来越大。
据统计,2012—2022年,AI领域的算力需求每年增长10倍,而摩尔定律显然已无法赶上这样的速度。截至2023年7月,我国数据中心机架总规模超过650万标准机架,服务器规模超过2000万台,算力总体规模已经超过了180 EFLOPS,存力规模超过1000 EB,位居全球第二。
虽然我国在数据中心建设方面做出了巨大投入,但我国对算力的需求增速预计将超过50%,其算力供给能力还大大落后于经济发展对算力的新需求,再加上区域布局分散、资源利用率不高等因素,导致我国仍存在极为巨大的算力缺口。
(二)算力基础资源分布不均
《中国人工智能计算力发展评估报告》显示,2017—2022年,我国算力规模平均每年增长48%,达到3.2×1012次/s。但与此同时,我国也面临着整体布局不平衡和资源分配不均衡的结构性失衡难题。算力服务资源和生产力等布局之间的失配问题尤为突出。
据前瞻产业研究院统计,东部沿海地区的算力资源占全国80%以上,而西部地区的比例却不足5%。具体来看,上海、北京、浙江等东部省市的云计算机房数量分别达到1500余座、1000余座、600余座,与西部省市形成了20倍以上的差距。
再如,东部地区AI相关企业数量近60万家,西部不足1万家。这种严重失衡的现象不但影响了我国算力服务资源的有效利用和优化配置,也造成了西部地区大量可再生能源的闲置和浪费。例如,西藏、青海、新疆等地区拥有丰富的水电、风电、太阳能等清洁能源资源,但由于缺乏相应的算力服务需求和基础设施,这些能源无法得到充分利用,甚至存在弃水、弃风、弃光现象。这不仅损害了我国能源安全战略,也降低了我国算力服务资源的绿色化和低碳化水平。
(三)资源流通途径尚未建立
在“东数西算”工程全面启动后,各算力枢纽节点、数据中心集群投资建设力度加大。但是,由于高效完备的多任务协同机制和资源流通共享途径尚未建立、海量数据跨广域交互效率困难等原因,导致算力节点通过网络灵活高效调配算力资源的能力不足,多源异构算力之间的壁垒现象愈发严重,各算力中心间的孤岛问题尤为突出,难以满足数据对算力随需处理的需求,使得算力服务陷入“用时空、闲时溢”的窘境。
具体来看,当前我国尚未建立统一开放的算力资源共享平台,各个区域的数据中心、高性能计算中心等算力设施之间缺乏互通互用机制,无法实现算力负载的动态调度,不同规格类型的算力资源无法有效整合,导致存量资源无法最大化利用。
与此同时,也缺乏安全高效的算力资源交易体系,使得供需双方无法精准对接,使得闲置算力资源难以有效流通配置。
此外,不同地区的网络带宽资源配备不均衡,东部沿海地区网络条件优越,而西部地区网络带宽较为匮乏,难以支持海量数据的快速传输与实时处理。这些因素共同导致了我国算力资源布局不均衡、利用效率不高等问题。
(四)技术服务标准尚未统一
我国在算力领域缺乏统一标准和规范,不同芯片生产商采用不同的指标来评估算力,使得异构设备之间难以比较,缺乏面向任务场景的算力评估模型,无法准确评估不同算力完成给定任务的性质,带来算力度量不准确、算力感知不完善、算力编排不智能、算力分发不公平、任务需求不清晰等难题。这些问题都反映了我国在算力领域缺乏牵引产业进步的公正“标尺”,使得各类专用芯片产生的诸多异构算力难以适应多样性计算平台发展,也使得算力资源难以实现互联互通和协同优化。
据2023年中国信息通信研究院的最新报告,超过80%的云服务提供商表示因缺乏统一的算力计量标准带来的成本损失占比超过10%;近3年,我国AI芯片种类增长超过5倍,但兼容不同芯片的算力平台数量不足100家,严重制约了异构算力的融合应用。这些问题导致我国算力格局碎片化,阻碍了算力资源的有效配置。
四、我国算力服务体系顶层设计
(一)算力服务形态基础
研究通过完备的调研分析,从商业模式、应用场景等不同维度出发,科学地总结了十余种典型算力服务形态,如表1所示,并对各类算力服务形态的特点、发展现状与趋势等进行了详细的分析和介绍。
研究梳理的算力服务基础形态反映了当前我国算力领域呈现出的多种技术形态并存的发展态势,系统地展示了以技术创新为核心驱动的算力服务发展轨迹,为政府和企业更好地把握我国算力发展全景提供基础性支撑和决策性参考,对促进我国新一代信息技术发展,实现从“数字中国”到“智能中国”的战略目标具有重要支撑作用。
表1 算力服务形态分类
上述这些算力服务形态并非孤立存在,而是相互关联、相互依托、相互促进的。具体来说,异构算力指集成多种处理器的混合型算力,可灵活适应不同类型应用的需求;边缘算力则致力于将算力下沉到网络边缘,实现低时延高效率的计算;绿色算力强调降低能耗、实现绿色环保;而云算力、分布式算力等则提供了不同的组织模式和资源调度机制。另外,联邦算力通过协同多个算力资源实现安全分布式计算;超级算力提供超大规模的计算能力;量子算力利用量子比特实现指数级加速;碳基算力关注碳中和目标;区域算力、跨境算力和全球算力则按空间范围进行区分。
算力服务形态的多元化发展景观反映出数字世界的蓬勃生机,并为数字经济发展提供了坚实的算力基础。在这一过程中,不同类型的算力服务各有侧重,互为补充、互利共生、协调发展、相互协作,相辅相成,形成了一个多层次、多维度的算力生态系统。例如,云算力提供基础设施,边缘算力延伸服务触角;异构算力提升计算效率,超算支持科研求解;量子算力开启新篇章,碳基算力引领可持续发展等。各级算力在技术、业务、应用等方面形成多重协同,推动算力服务整体水平不断提升。
此外,随着数字经济的深入发展,各行各业对算力服务的需求也越来越细分和个性化。为了更好地满足这些需求,当前算力服务形态也在向专业化和协同化方向发展。一方面,针对不同行业和领域的特点和需求,算力服务提供商推出了更加精准和专业的行业解决方案,如金融云、医疗云、教育云等,为用户提供了更加便捷和高效的行业应用支持。另一方面,针对不同用户和场景的需求差异和多样性,算力服务提供商也在探索更加灵活和协同的服务模式,如混合云、多云、联合云等,为用户提供了更加自由和优化的资源配置选择。
总之,当前算力服务形态正处于一个快速发展和创新的阶段,呈现出多元化、专业化、协同化的发展特征。未来算力服务形态将继续保持新鲜的创新活力,为经济社会数字化转型带来更多价值和可能。
(二)算力服务演进模型
为了更好地适应和引领数字经济的发展,研究结合国内外实践经验,参照算力服务形态,并根据算力集中度,提出了具有理论价值和实践意义的五阶段算力服务演进模型,分别是:L0级别原生算力、L1级别复合算力、L2级别集群算力、L3级别区域算力和L4级别全域算力,如图1所示。
这一模型既符合算力发展的客观规律,也为数字经济发展提供了指引。这套全面、科学、可行的算力演进模型,将为政府制定数字经济发展战略和规划提供理论依据和实施路径,并为算力服务的发展方向提供科学系统的指导。
图1 算力服务的演进模型
L0级别原生算力:是指由硬件设备直接提供的计算能力,是一种无法再分割的最简单算力形式,如CPU、图形处理器(GPU)、现场可编程门列阵(FPGA)、专用集成电路(ASIC)等。原生算力可以根据不同的硬件特性和应用场景,划分为异构算力、边缘算力、绿色算力等。例如,异构算力是指利用不同类型的硬件设备协同完成计算任务,如GPU和CPU的混合计算;边缘算力是指在网络边缘部署的计算资源,如智能手机、物联网设备等;绿色算力是指利用可再生能源或低碳能源驱动的计算资源,如太阳能、风能等。
L1级别复合算力:是指由多个原生算力组合而成的计算能力,如云算力、分布式算力、联邦算力等。复合算力可以根据不同的组合方式和协作模式,又划分为集中式复合算力、去中心化复合算力、半去中心化复合算力。例如,集中式复合算力是指由一个中心节点控制和调度多个原生算力节点的计算任务,如云计算平台;去中心化复合算力是指由多个原生算力节点自主协商和协作完成计算任务,如区块链网络;半去中心化复合算力是指由一个中心节点提供一定的协调和监督功能,但不直接干预原生算力节点的计算任务,如联邦算力。
L2级别集群算力:是指由多个复合算力组成的更高层次的计算能力,如超级算力、量子算力、碳基算力等。集群算力可以根据不同的规模和性能,划分为小型集群、中型集群、大型集群、超级集群。例如,小型集群是指由几十个或几百个复合算力节点组成的计算系统,如个人或企业的私有云;中型集群是指由几千个或几万个复合算力节点组成的计算系统,如高校或研究机构的科学计算平台;大型集群是指由几十万个或几百万个复合算力节点组成的计算系统,如互联网公司或政府部门的数据中心;超级集群是指由上亿个或更多复合算力节点组成的计算系统,如国家级或国际级的超级计算机或超算中心。
L3级别区域算力:是指由多个集群算力覆盖一个特定地理区域的计算能力,如智慧城市、区域互联网、跨境协作等。区域算力可以根据不同的区域范围和特征,划分为城市区域、省级区域、国家区域等。例如,城市区域是指由一个城市内部的多个集群算力构成的计算网络,它可以支持智慧城市、智能交通、智能医疗等应用;省级区域是指由一个省份或地区内部的多个城市区域构成的计算网络,它可以支持区域互联网、大数据分析等应用;国家区域是指由一个国家或地域内部的多个省级区域构成的计算网络,它可以支持跨境协作、国家安全等应用。
L4级别全域算力:是指由全球范围内的多个区域算力构成的最高层次计算能力,如全球互联网、全球协作、全球治理等。全域算力可以根据不同的全球性和普适性,划分为开放式全域算力、封闭式全域算力、混合式全域算力。例如,开放式全域算力是指由任何区域算力都可以自由加入和退出的计算网络,如公共互联网;封闭式全域算力是指由特定区域算力或组织构成的计算网络,如军事联盟或贸易协定;混合式全域算力是指由开放式和封闭式全域算力共存和互动的计算网络,如多边机制或跨境合作。
(三)算力服务整体框架
为了实现算力的有效调度与资源的优化配置,需要建立统一开放的算力服务与交互体系,使各类算力资源实现互联互通,以满足不同用户的算力需求。
同时,算力服务体系应以国家政府为主导,以数据中心、云服务商、科研机构和企业等单位为算力主体,构建以主算力体为中心的大规模分布式区域算力集群,实现泛在算力的感知、互联和调度,以满足不同应用场景的算力需求。
还应积极探索算力的多元价值,让算力不仅能够提供计算服务,还能够融与数据分析、AI、区块链等应用领域,实现算力的价值最大化。研究设计了数网协同、数云协同、云边协同、边端协同的多层次多梯度顶层框架,提出了我国算力服务体系的整体框架,如图2所示。
图2 算力服务体系顶层框架
研究设计的顶层框架,旨在为我国算力服务提供创新性指导。该框架有助于实现我国算力的供给、运营和消费之间多阶梯解耦,打破原有数据孤岛、计算孤岛和算力孤岛,消除区域壁垒和部门壁垒,使各类算力资源实现互联互通、动态配置。该框架有利于进一步促进全国范围内算力资源一体化高效调度,对指引未来算力规划建设、完善体制机制、创新应用模式等方面具有重要借鉴和指导作用。
算力资源层:是指由大量单核CPU、GPU和FPGA等算力基础设备组成,这一层的目标是提供基础的硬件设施支持,以满足各种计算需求。这些设备具有不同的性能、功耗和成本特点,可以根据不同的应用场景和算法需求进行灵活的组合和配置。
算力融合层:由算力资源层提供的多种算力形态,结合算力网实现跨区域跨层级的云、边、端算力高速互联和数据传输,形成大规模分布式算力资源池。各算力资源池通过算力网连接形成互联互通的算力有机体,汇聚和共享算力、数据和应用资源,为不同场景和需求的算力服务提供了强大的支撑。
算力运营层:其职能是用尽各种手段保证算网业务系统的稳定性、可用性、安全性,打通算力封装、算力并网和算力接口等环节,形成行业统一标准,打造“一站式”算力运营平台,使其具备定价、交易、结算和维护等职能,形成闭环自动化的智能运营模式,实现跨厂商、跨地域、跨应用一体化智慧化运维。
算力服务层:算力服务层的作用是为算法提供资源,使其能够应对不同的需求和挑战。算力服务层的核心是数据,数据为算法提供支撑,使其能够处理复杂问题和多元场景;而算法则为数据提供技术支撑,使其能够产生有价值的信息和知识。算力服务层可以根据算法的特点和目标,动态分配和调整资源,以达到最佳的性能和效果。算力服务层是一种创新的技术,为数据和算法之间建立了一个高效、灵活、可扩展的桥梁。
算力应用层:让算力像“自来水”一样普及供给,代表着人类社会向数字化、智能化转型迈出了坚实步伐。这一举措不仅可以显著提升终端应用的响应速度和服务体验,更为各行各业发展提供了有力的基础保障。
五、我国算力服务体系的重点战略与发展路径
(一)算力服务重点战略
研究围绕算力服务这一核心宗旨,提出了我国算力服务的五大重点战略,分别是宏观层面的规划布局、产业层面的实践创新、企业层面的创新驱动、技术层面的升级提升、用户层面的体验优化,如图3所示。这五大战略从不同的角度阐述了我国算力服务的特点和优势以及在各个领域的应用和发展前景。
图3 算力服务五大战略体系
宏观层面的规划布局:应明确算力服务产业的定位和功能,制定全面、系统、前瞻的产业规划,推动相关政策法规的制定和执行,吸引更多的资本、技术和人才进入算力服务领域。同时,还应加强对算力服务标准化和监管体系的建设,以保障算力服务行业的健康有序发展,并促进算力服务产业与数字中国战略的深度融合,为我国数字化转型提供更强的支撑。
产业层面的实践创新:算力服务应依靠政府支持政策和市场需求,通过不断实施差异化发展战略、拓展算力服务的创新应用、加快技术创新和产品迭代升级,以实现核心技术突破和产业链价值链延伸。算力服务企业应积极参与产业链协同创新,构建良好的生态系统,不断提高自身创新能力和服务水平,推动算力服务行业的高质量发展。同时,也应加强与社会各方的沟通和交流,深入了解市场需求和用户需求,为实现数字化转型提供更具针对性和适应性的算力服务。
企业层面的创新驱动:算力服务企业应持续增强创新意识,注重人才培养和技术研发投入,积极探索新的商业和服务模式,并深度挖掘用户需求,在提供更加个性化和高效算力服务的同时,为客户创造更高的价值。此外,还应加强合作伙伴关系,共同推进算力服务生态圈建设,实现多方合作共赢,促进整个算力行业的健康有序发展。
技术层面的升级提升:算力服务需要加强对新兴技术的运用和研发,如AI、区块链、物联网等,以提升算力服务的智能化和安全性。同时,算力服务还需要不断推动算力服务业务的创新和升级,以更好地满足用户不断变化的需求和不断提高的服务标准。因此,在技术层面进行升级提升,加强新技术的运用和研发,已经成为算力服务发展的必然选择。
用户层面的体验优化:算力服务应加强用户研究,深入了解用户需求和痛点,通过优化算力服务体验,提高服务质量和用户满意度。为了构建可信赖、高效、便捷的服务体系,算力服务企业应借鉴最佳实践,结合数字化技术,打造智能化服务平台。通过与用户的紧密互动,以不断优化服务流程和功能的模式,满足不同行业、不同领域用户的需求,最终实现用户价值最大化。
(二)算力服务发展路径
随着数字经济的蓬勃发展,我国对高性能算力服务的需求正在持续增长。明确未来的发展方向,实现算力服务的优化升级,是我们当前面临的另一大难题。研究认为,算力服务路径探索是一项庞大复杂的系统工程,需要从统筹算网布局、统一行业标准、保障信息安全、培育产业生态、促进低碳发展五个维度进行重点部署,以确保整个算力服务体系的适用性和鲁棒性。
统筹算网布局:从全国层面规划建设算力“一张网”,加强算力网络顶层设计和统筹布局,避免重复建设算力基础设施,合理细分各领域重点发展方向。深化跨地区、跨部门、跨行业之间的合作交流,在政策制定、项目建设、技术创新等方面形成合力和协同效应,完善机制设计,统筹东西部的需求与供给。打造国家级的算力调度和社会级算力交易平台,促进算力资源的合理分配和高效利用,降低空置率和浪费率,让算力价格普惠,实现算力成为像水、电“一点接入、即取即用”的社会级服务。
统一行业标准:当前,算网行业标准处于起步阶段,存在标准数量不足、标准质量不高和标准实施不力等亟需解决的问题。据悉,国内已成立算网融合产业及标准推进委员会(CCNIS),旨在推动算网融合技术和产业发展。因此,应加强算网需求分析和技术预研,鼓励相关单位和政府职能部门积极开展系列行业标准的立项和制定工作,以国家行业统一标准的形式,通过征求意见稿、立项评审、审查批准等程序,制定符合国际规范和国内需求的行业标准。此外,还要建立有效的监督检查和评估机制,推动行业标准在各个领域和场景中得到广泛应用和落地,促进算网产业发展。
保障信息安全:算网体系庞大,系统安全风险高,亦需从数据安全、算力安全、网络安全等维度进行维护。通过建立健全算网内生安全免疫能力体系,打造边界、网元、全网安全三道防线,完善数据安全存储、数据安全加密、数据安全传输等用户数据隔离机制,实现算力网络的防护、检测和响应。此外,结合区块链、云原生和数字孪生等技术实现算网节点安全的全过程溯源和可视化预警,确保算力节点统一身份认证、信任评估和可信流传,保证算网不被篡改数据、植入恶意代码、执行非法操作或造成系统崩溃。
培育产业生态:为了打造数据驱动、应用引领、基础支撑的协同创新和共享共赢的算力服务体系产业生态,各试点城市应积极参与“算网大脑”建设,整合数据样本池,实现“数据+算法+算力+算网”四位一体的生态格局。政府应引导和支持各方主体进行靶向投资、协同创新、资源共享等方式,推动东西部数据中心集群同步投资、联动运营项目,实现产业上、中、下游的全面协同和资源整合,提高算力服务体系产业生态的整体效益和创新能力,如图4所示。
图4 算力服务生态培育
促进低碳发展:算力基础设施需要采取有效措施,降低能耗和碳排放,助力我国实现碳中和、碳达峰的目标。因而,要推动数据中心等算力基础设施向绿色低碳转型,采用液冷、高压直流电、可再生能源等节能技术,发展高性能、高可靠、低功耗的新型算力设备和系统,提高运行效率和节能水平。健全算力资源的节能监测和评价机制,建立能耗限额、碳排放指标等标准体系,加强对数据中心等重点行业领域的节能管理和督导,引导行业合理控制规模扩张和能耗增长。
另外,要优化算力资源的布局和分配,实施“东数西算”工程,将数据中心集群部署在西部地区,利用当地丰富的清洁能源和低温环境,降低能耗和碳排放。
六、我国算力服务体系发展建议
(一)强化算力服务合作,拓展算力服务影响
一是加强与政府、企业、高校等各类机构的算力服务合作,提供高效、安全、稳定的算力支持,助力各领域的数字化转型和创新发展。
二是积极参与国际算力服务市场的竞争和合作,打造具有国际影响力的算力服务品牌,推动算力服务的全球化布局和标准化建设。
三是深入探索算力服务的新模式和新应用,结合AI、大数据、云计算等前沿技术,为客户提供更加智能化、个性化、多元化的算力服务解决方案。
四是坚持以客户为中心,不断提升算力服务的质量和水平,满足客户的多样化需求,赢得客户的信任。
(二)鼓励各界积极参与,形成算力发展合力
一是坚持合作共赢的理念,以城市算力中心和国家算力枢纽节点为引领,吸引社会资本投入算力基础设施建设和算力服务产业发展。
二是应加强金融机构与政府在多样性算力重点领域和薄弱环节的合作,共同探索可复制、可推广的试验经验。
三是打造计算产业链、供应链的长板,不断优化高性能计算系统整机能力,加速软硬融合与异构计算协同创新,以满足海量数据、多元场景的计算需求。
四是注重补齐产业链、供应链的短板,孵化新的计算生态系统,促进产业链上下游企业的协同创新,建立可持续的软硬件适配生态。
(三)加强算力服务保障,防范算力服务风险
一是建全以云数、云智、云边、云网为基础的多源算力服务框架和算网自治管理机制,通过设立灵活的付费机制和资费规范以降低算力服务使用壁垒,持续完善算力服务的数字化、平台化和规范化。
二是建立健全算力服务的规范和标准,明确算力服务的范围、内容、流程、质量要求等,规范算力服务的提供和使用,提高算力服务的透明度和可信度。
三是加强算力服务的监督和管理,建立健全算力服务的监测、评估、审计、考核等机制,及时发现和解决算力服务的问题和风险,保障算力服务的合规性和合法性。
四是加强算力服务的技术支持和创新,不断提升算力服务的性能和效率,优化算力服务的架构和模式,推动算力服务的集成和共享,促进算力服务的创新和发展。
(四)发挥算力人才优势,助力核心技术突破
一是我国应充分发挥超大规模市场和新型人才体制的优势,紧扣科技自立自强的要求,利用高能级科研平台的科技攻关优势,不断开展算力服务的前沿探索和创新实践。
二是不断加快存算一体、量子计算、类脑计算等前沿领域的研究,打造以算力为核心的软硬件协同技术创新体系,培育出算力服务的核心竞争力和品牌影响力。
三是通过设立专项人才引进计划、建立人才培养基地等措施,积极引进高端人才,加强算力人才培养和团队建设,提升绿色算力产业技术研发水平。
四是加强“产学研用”协同机制,优化算力产业创新资源配置,以优质企业、高水平产业集聚区和产业创新平台为载体,着力进行先进计算领域高端人才的培养。
(五)培育算力服务文化,塑造算力服务形象
一是推广算力服务的宣传和交流,加强算力服务的品牌建设和形象塑造,展示算力服务的成果和价值,增进算力服务的社会认知和影响力。
二是推动算力服务的协作和共享,建立算力服务的合作和交流平台,促进算力服务的资源和信息共享,实现算力服务的协同和共赢。
三是倡导算力服务的责任和担当,强化算力服务的法律意识和道德规范,履行算力服务的社会责任和公民义务,展现算力服务的良好形象和风采。
四是营造算力服务的氛围和文化,强化算力服务的认同感和归属感,增加算力服务的参与度和满意度,提高算力服务的忠诚度和口碑。
来源:我国算力服务体系构建及路径研究[J].中国工程科学,2023,25(6):49-60.
本文来自微信公众号:中国工程院院刊 (ID:CAE-Engineering),作者:陈晓红(管理科学与工程、工程管理及数据智能专家,中国工程院院士)、许冠英、徐雪松、田志平、霍杨杰、易国栋