美国重夺全球超算第一！人类实现百亿亿次E级超算，Frontier屠榜全球Top500

已经霸榜两年，完成四连冠的日本富岳终于跌落了「神坛」。
在刚刚公布的2022年全球超算top500名单中，美国橡树岭国家实验室（ornl）的frontier夺得第一。凭借1.102 exaflop/s的hpl分数，frontier不仅是有史以来最强大的超级计算机，它也是第一台真正的「e级超算」。
相比之下，中国的神威·太湖之光和天河二号排名下滑至第六和第九。去年，美国将神威·太湖之光的处理器供应商申威列入了实体清单，或多或少给中国超算的发展造成了影响。
这次top500的64位浮点计算总算力为4.4 exaflops，比六个月前的上一期榜单增长了44.7%。
frontier：突破百亿亿次那么，frontier的性能到底达到了怎样「逆天」的程度呢？！简单来说，就是把排在它之后的468个超算的算力加起来，都比不过一个frontier。
除了如此炫目的算力之外，frontier还是全球跑ai最快的超级电脑之一。在hpl-ai基准的混合精度性能测试中，frontier跑出了6.88 exaflops的成绩。
用白话说，这个性能相当于，给一个860亿神经元组成的智能体中的每个神经元，每秒都下达6800万个指令。用这个训练ai大模型，那可真是火箭发动机搭上了一级方程式赛车，可以直接在赛道上起飞。全新的frontier占地372平方米，由74个hpe cray ex机柜组成，可容纳9408个节点。
其中，每个节点有一个amd milan 「trento」 7a53 epyc cpu，搭配512gb ddr4内存和4个amd radeon instinct mi250x gpu。总的来说，该系统有602,112个cpu核心，与4.6pb的ddr4内存相连接。此外，37,888个amd mi250x gpu具有8,138,240个核心，并搭配了4.6pb的hbm内存（每个gpu有128gb）。 cpu和gpu使用基于以太网的hpe cray slingshot-11网络结构进行连接。
储存上则与一个性能极佳的存储子系统相连，有着700pb的容量，75tb/s的吞吐量和150亿iops的性能。元数据层分布在480个nvme ssd上，提供10pb的整体容量，而5400个nvme ssd为主要的高速存储层提供11.5pb的容量。同时，47,700个pmr硬盘提供679pb的容量。
散热方面，基于水冷的系统让6000加仑的水在350马力的泵在整个系统中「移动」，由此将温度控制在了85度左右。直观来说，这些水泵可以在30分钟内填满一个奥林匹克标准游泳池。 frontier不仅是现在世界上最快的超算，也是最环保的超算。
frontier的能耗比，亦居全球超算的环保程度green500榜单之首。单个由第三代amd的epyc处理器与instinct mi250x加速器组建的机柜单元，其能耗效率是每瓦电能运算62.68 gigaflops。
不过，想把frontier组装起来可不容易，ornl必须采购685个不同编号的6000万个部件。此外，在建造过程中还不得不去应对芯片的短缺。
ornl受影响的零件编号有167个，算下来是200万个零件。而amd缺少mi200 gpu的15个编号的零件。
于是ornl与ascr合作，为这些零件获得了国防优先权和分配系统（dpas）评级，这意味着美国政府可以使用年度的防务预算，用显著高于市场价的更优厚价格来采购这些部件。很快，「短缺」的问题也就得到了解决。
经过这波操作，是不是可以解开很多人心中所谓的「疑惑」了呢？美国：为了我们的国防事业，加大力度搞超算！
虽然这么花钱，但用处不可谓不广。在英伟达老黄这种财主老爷都要做地球数字孪生体的时代，各国官方部门的超级计算机在开发处理庞大数据的ai、模拟气候和产业用途等方面越来越重要。就算橡树林自己用不完这算力，也可以租、售嘛，工业界对算力可是嗷嗷待哺。
而且这已有他国先例：在预测机床材料加工结果的实验中，日本dmg森精机床自带工业电脑需要8小时，但富岳只需要10分钟就完成了。
中国：玩你们的，我就看看在新一期榜单上，中国和美国仍然是上榜最多的国家。
在上榜超算数量上，中国仍为173台，和上期持平，继续位列榜首。美国从上期的150台下降到127台，排名次席。尽管如此，这两个国家仍然占了top 500榜单总数的60%。日本、德国、法国分别以34、31、22台位列3-5位。
虽然此次frontier正式成为世界上最强大的超级计算机，但它还没有与去年被曝光的两个中国超算进行比较。不过，这两个系统目前都没有向top500提交测试数据。
根据爆料的数据，有不少外媒推断sunway oceanlight（神威·海洋之光）超级计算机在hpl基准上的峰值约为1.3 exaflops/1.05 exaflops，而天河三号则能够达到1.7 exaflops峰值/1.3 exaflops持续值。然而，考虑到美国在芯片上的各种「卡脖子」，中国超算刷榜的后果很有可能就变成了一个制裁的「靶子」，想必短时间内应该不会看到任何有关数据的更新了。
上榜数量占比上，中国以34.6%的比例占据榜首，美国以25.4%的比例位列第二，中美争霸的态势依旧。
而在总性能排行榜上，美国的优势仍然不可动摇，以47.3%的总算力牢牢占据首位，不难看出，此次登顶的frontier为美国稳定霸榜贡献不小。
此外，此次top 500榜单还统计了自1990年起超算算力的进步趋势，并进行了线性回归。表中横轴为时间，纵轴为算力（取对数）。
绿色点为上榜超算的总算力，黄色三角为榜单冠军的算力，蓝色方块为榜单倒数第一（第500名）超算的算力。对应颜色的直线为线性回归的结果。可以看到，这三条直线大致符合摩尔定律的对算力提升的预测性判断。都说摩尔定律已死，看起来在超算领域，它还活的很好很健壮。
欧洲崛起：top10占据7席美国并不是唯一取得显著成绩的地区。欧洲也表现良好，从总排名上看，美、中、日占据前3，前十中剩余的七席则全部为欧洲国家占据。
其中德国上榜31台，法国上榜22台，意大利上榜14台。芬兰新部署的lumi超级计算机以151.9 petaflops的fp64性能勉强超过美国的summit，获得第3名。
另外，法国genci-cines的adastra以46.1 petaflops的性能险些夺得第10名。虽然远不及lumi强大，但adastra仍然保持着欧洲第二强大的超级计算机的殊荣。 lumi和adastra等系统也说明了另一个趋势。与frontier一样，它们基于hpe的全amd cray ex平台，使用第三代epyc cpu和instinct gpu。
为啥不用gpu加速：还是差钱长久以来，amd第一次在top500中的系统内的主机cpu中占有代表性的份额，但英特尔至强处理器仍然占主导地位。
从本世纪初开始，英特尔在高性能计算领域开始发力，只用了几年时间，就将ibm、惠普等几家之前的主要玩家排挤得元气大伤。从2017年到2020年，英特尔在高性能计算领域达到极盛的市场占有率一度超过90%。
直到目前，英特尔的份额仍高达77.4%，下降了4.2个百分点，而amd的份额正好上升了这个数字。预计epycs会在与xeon sp的竞争中获得更大的动力。而且，amd有后来居上的势头。在2022年的全球超算top500榜单中，现在有94台超算依赖amd的产品，年度增长95%。而且amd的 instinct mi200 加速器首次被其中7台超算采用。
另一个问题是，为什么不用gpu加速器？可能是因为贵？ gpu加速器作为计算引擎，可以提升巨大的性能和性价比，但目前，加速器并没有在top500榜单上的超算架构中占据主导地
位。这些gpu加速器主要是英伟达的。但是，除了英伟达自家的hpc中心有大量应用需要移植到gpu上，而且不差钱之外，世界上成千上万的其他hpc中心还是差钱的，这些hpc的代码是明确为cpu编写的。
目前的top500榜单中，只有170台超算采用了gpu加速器--当然大部分来自英伟达。另一个因素是，更便宜的cpu本身现在也在陆续添加类似于gpu的加速计算功能，比如向量和现在的矩阵计算等。
这样就比将cpu程序转移至gpu运行更省钱，也更容易编程。我们可能永远不会看到一个主要由gpu加速系统组成的top500榜单了。事实上，在「富岳」、「太湖之光」这样排名靠前的超算系统中，cpu基本上充当了具备向量和矩阵计算型gpu的作用。
以上就是美国重夺全球超算第一！人类实现百亿亿次e级超算，frontier屠榜全球top500的详细内容。

美国重夺全球超算第一！人类实现百亿亿次E级超算，Frontier屠榜全球Top500

推荐信息