扫码打开虎嗅APP
作者:本来科技,题图来自:IC photo
一夜之间,世界最强超算易主。
6月22日~25日,本该是国际超算大会(ISC2020)在法兰克福召开的日子。但鉴于全球疫情阴影笼罩,ISC2020也由线下改为线上召开。
所以今年的ISC大会,又称为ISC 2020 DIGITAL(NO ISC 2020 IN FRANKFURT; A DIGITAL EVENT FROM JUNE 22 - 25 INSTEAD)。
每次ISC大会,都会发布一次“全球最快的500台超级计算系统榜单”,即全球超算TOP500榜单(另一次是11月份在美国举行的SC大会)。在今年的ISC 2020 DIGITAL上,揭晓的是第55期TOP500榜单。
狂揽4项冠军,日本超算“富岳”傲视群雄
与去年11月SC19大会上TOP500榜单波澜不惊(前几名没啥变化)不同,此次榜单的前几名多了不少“新势力”。最大的变化,当属排名第一的超算由美国的顶峰(Summit),变成了日本的“富岳”( Fugaku)。
日本超算 Fugaku成为新科超算冠军
日本“富岳”由富士通公司(Fujitsu)和日本理化学研究所共同设计研制,其Linpack值达到415.5PFlops,性能是上届榜单冠军Summit的2.8倍,“神威·太湖之光”的4.5倍。
另外,“富岳”系统的核心处理器采用的是48核的ARM芯片A64FX,这是历史上第一台基于ARM芯片的超算系统成为全球超算TOP500的冠军。
更值得一提的是,“富岳”超算系统在更注重超算应用性能的基准测试HPCG和“人工智能超算性能Linpack”基准测试“HPL-AI”中,也排名第一,足见该系统的实力超群。如果不是有另外一台日本超算系统“挡道”,富岳系统还差点拿下评价超算绿色指数的Green500的冠军。
差点忘了,“富岳”系统还赢得一项冠军:Graph500第一。通常,Graph500排行榜强调的是内存带宽和延迟,侧重于大数据分析等领域的计算能力的比拼。能拿下Graph500第一,说明富岳系统的图表解析计算性能超群。
Fugaku一举夺得4项性能第一
富岳系统登顶后,美国超算Summit和Sierra屈居二、三位,曾经4连榜首和6连榜首的中国超算“神威·太湖之光”和“天河二号”,在本次榜单中排名四、五位。
榜单的前10位中,还有3台“新势力”:排名第6的HPC5,由意大利能源巨头Eni出资研制;排名第7的Selene,由英伟达首次推出,搭载了AMD EPYC处理器+最新的A100GPU;排名第9的Marconi-100,部署在意大利计算中心。
第55届全球超算TOP10
在公布本届TOP500榜单之时,榜单发布人还特别提到,以最高性能运行、处理单精度运算或进一步降低精度的运算时,富岳系统的性能超过1000 PFlops(即1 EFlops,也即E级超算的“E”)——这是人类历史上第一次摸到E级超算的边。
目前各超算大国(美国、中国、日本、欧盟诸国)都制定了向E级超算进军的目标,预计明年将会有多台E级超算产生。
日本不再低调,超算三强三足鼎立
大家也注意到了,标题中虽写的是“一夜之间,最强超算易主”,也只是说榜单发布一事,其实超算格局的变化背后,绝不是“一夜之间”那么简单。
就拿日本来说,日本在超算领域真正做到了“韬光养晦,不称霸主”。以日本超算的实力,取得如今的成绩绝不是偶然。
说起来,在中国超算崛起之前,以前跟美国超算在TOP500榜首轮流“坐庄”的,就是日本超算。日本用于地球数值模拟的超算系统,在业内也是鼎鼎大名。
抛开一些不可说的因素,中国超算在本届TOP500榜单上,“只”剩下“数量优势”。
在TOP500的国家份额上,中国大陆上榜226台系统(台湾地区超算未计入此数字),占总上榜数的45.2%;其次是美国,114台;日本排在第三位,上榜30台。
本届TOP500榜单中国上榜226台系统,主要来自联想、曙光、浪潮三家
但是,在性能份额(也就是上榜HPC系统所能提供的算力)上,美国114台超算所能提供的计算份额是644PFlops,继续力压中国,565PFlops;日本虽然只有30台,但其可提供的算力为530PFlops,性能份额达到23.7%。
按照算力来划分的话,美国、日本、中国可以说是三足鼎立了。
美、中、日分别占算力份额的28.7%、25.5%、23.7%
其实,按照超算实力来划分,说日本与美国、中国三足鼎立,也丝毫不为过。这次“富岳”霸榜TOP500、Graph500、HPCG、HPC-AI,已经充分说明了日本超算无论在性能、架构、应用、功耗、网络互连等方面的技术实力。而且,从早期的地球模拟器,到“京”再到今天的“富岳”,日本超算一直都是自成体系。
遥想2016年我国科研人员基于“神威·太湖之光”夺得“戈登贝尔奖”之时,日本理研计算科学中心负责人松岗聪教授(Satoshi Matsuoka,RIKEN Center for Computational Science)还吹捧“中国已成为了高性能计算机领域的世界领导者之一”,现在看来,日本人真的谦虚。
造价10亿美元,“富岳”贵不贵?
在写这篇文章的时候,恰好看到某群内对“富岳”超算的造价讨论非常热闹,现在借花献佛,整理出来以飨读者。
据松岗聪教授透露,“富岳”超算的造价大概花了10亿美金( the total to about $1bil US),折合成人民币,大概70亿元。
这还只是富岳超算的“物料费用”(material bill for the machine)。松岗聪教授说,如果使用成品CPU(我理解是这个意思),可能还要再贵3倍。
一位专家说,国内建设一台大型超算的总投入大概50亿元,但是要把所有成本算进去,包括土地、基建、人员等,最后花在机器设备上的钱可能只有1/10。而“富岳”超算,是直接把原来的“K”超算拆掉,原地安装“Post-K”,是“把所有钱用在刀刃上”。
日本“富岳”超算,图片来自Jack Dongarra对“富岳”的报告文件
作为对比,一位专家“八”了一下前冠军Summit的预算,他说,虽然没有得到准确的数字,但普遍估计Summit的花费在2~3亿美元之间(Summit的规模是富岳的36%)。
正在群里诸人对“富岳”超算“超贵”咋舌之际,北京大学数学科学学院教授杨超说出的一句话得到了大家的赞同:
造一台拿Top500第一花70亿人民币确实贵了,但造一台拿四个榜单第一而且大幅超越第二名的机器花70亿人民币我真的觉得不贵,而且很便宜。
这位杨超教授,就是2016年凭借基于“神威·太湖之光”的超算应用获得中国首个“戈登贝尔奖”的负责人之一。
国防科大一位老师补充说,“富岳”四项第一,说明综合性价比真的非常高,70亿人民币确实不算贵。
正在此时,上海交大超算中心负责人林新华提出,“富岳”设计得比较均衡,更多考虑实际应用的性能——这对我国设计E级超算方案是个重要参考。
此言不虚。随着“富岳”超算在E级规模计算上的尝试,下一个超算目标,就是E级超算了。随着中国神威、天河、曙光3套E级超算原型机的落位,美国政府部门近年来在超算上的高调布局,E级超算逐鹿之战,已经拉开。
犹记得年初,人民日报发布的一条新华社消息,说《科学》杂志认为中国会在2020年建造出世界第一台E级超算。
今年初,《科学》展望2020,称中国或造出世界首台E级超算
需要说明的是,各国竞逐E级超算,并非单纯地追求“打榜”和“规模”,这其中更多是对先进计算技术——网络、访存、功耗、存储等的考验,只有技术实力过硬,才能做出性能均衡、应用性好的超级计算机。
作者:本来科技