这次,较小的高性能计算中心推动了前500超级计算机排名的前列

智能计算 时间:2025-12-02来源:

在过去两年里,我们一直在剖析被称为Top500的超级计算机半年排名,采用另一种方式,重点关注每年六月或十一月进入各榜单的新机型。我们认为,这让我们了解人们目前购买超级计算机时的做法,而不仅仅是仅仅关注那些通过高性能LINPACK(HPL)基准测试提交基准测试的五百台机器。

这是自2024年6月以来最弱的榜单,当时我们首次以这种方式分析Top500,包括新机器和核心和Rpeak flop的整体表现。不过,这并不算糟糕。只是名单上没有太多新的大型机器,就像2024年6月时一样。这是升级周期和融资周期的一部分,而在生成式AI出现之前,这两者联系更紧密,传统高性能计算不再是主导者。

我们认为传统的高性能计算(HPC)能做更多实际工作,即使美国和欧洲实行核武器管理,从长远来看,破坏力也比人工智能低。

自2025年6月榜单锁定以来,已有45台新机器启动,运行了HPL基准测试,并提交了结果给Top500组织。这并不意味着过去五个月全球只安装了45台相对较大的超级计算机。有很多机器不提交HPL测试结果——尤其是中国国家实验室和伊利诺伊大学国家超级计算应用中心的集群都抵制Top500——即使它们确实在系统调试中运行了测试。Top500是一个重要的指标和数据集,但它绝不能涵盖整个高性能计算市场。

1764656624122238.jpg

这45台新加入Top500名单的机器拥有648万个核心——包括GPU上的流式多处理器和CPU核心——峰值总性能为1.48亿亿次浮点运算。2025年6月,名单新增容量大约是2025年的两倍,2024年11月则因美国国家实验室HPC系统管理权的更替,新增容量几乎是其三倍。我们之前已经写过所有这些机器,不会再详细介绍这些系统的供电和速度。你可以自己阅读列表以了解详情。

不那么明显的是,名单上最新的机器——由软银安装的CHIE-4系统——是最大的新系统,但它在名单中仅排名第17位。KAUST的Shaheen-III GPU分区是本次仅新增的五个英伟达CPU-GPU超级芯片系统之一,排名第18。

这五台基于英伟达“Grace” CG100 Arm服务器CPU的超级计算机,配合其“Hopper” H200或“Blackwell” B200 GPU加速器,在64位精度下实现了197.1拍浮点峰值性能,约为今年7月至11月间新增FP64精度容量的13.3%。

我们觉得有趣的是,有21台机器搭载了Intel Xeon CPU,并搭配H100、H200或B200 GPU加速器。这21台机器合计贡献了698.9千万亿次浮点次的FP64总性能,占本次FP64总性能1.48亿次浮点的47.3%。

列表中一台有趣的新机器由戴尔为美国联邦政府服务提供商Maximus打造,使用其PowerEdge服务器,配备英特尔“Emerald Rapids”Xeon 5处理器,配合AMD Instinct MI300X GPU加速器。该机器的峰值计算量为251.2千万亿次运算,占11月Top500排名新装容量的17%。

有两台机器基于著名的AMD MI300A混合加速器,这些加速器曾被著名地部署在劳伦斯利弗莫尔国家实验室的“El Capitan”超级计算机中。这台机器依然位居Top500榜首,峰值峰值为2.821亿次浮点运算,HPL测试中Rmax为1.809亿次浮点运算。11月名单中几台新机器混合了AMD Epyc CPU和Nvidia Hopper GPU,另外有6台新机器仅使用AMD Epyc CPU作为计算引擎,另外5台全新机器则完全使用Intel Xeon CPU。仅支持CPU的机器仅占Rpeak总容量的9.4%,尽管它们占11月新增系统的24.4%。


我们总是对加速的机器数量感到好奇,而在2025年11月的Top500排行榜中,突破了超过五百台机器的一半:

1764656806718511.jpg


总体来看,这次Top500的总性能为22.16亿次浮点,加速机器以19.11亿次浮点运算占86.2%。仅有CPU系统的FP64总动力量仅占13.8%。

在加速的机器中,AMD GPU占性能指数的37.8%,其中Nvidia GPU占51.3%,Intel GPU占10.9%,其他加速器占不到几个%。AMD和英伟达在高性能计算领域的份额分布可能是整个市场的领先指标,并且与我们上周AMD预测报道中计算的英伟达收入份额非常接近。(澄清一下,Top500 是在我们写完那篇 AMD 报道之后才发布的。)

虽然明年将是生成式人工智能训练和推理中心的繁荣期,但即使未来几年美国能源部将在橡树岭国家实验室、阿贡国家实验室和洛斯阿拉莫斯国家实验室资助九台新机器,传统高性能计算中心的资金来源仍不明朗。关于这些机器,我们目前还没有太多细节,这些机器将采用Nvidia和AMD的计算引擎。我们希望本周在SC25上能了解更多。

无论如何,要让超级计算重回摩尔定律曲线,都需要巨大的投资,而行业多年前就已经滑落了这个曲线:

1764656847265860.jpg

正如你从上面图表中看到的,这张图表来自Top500数据集本身,世界上最大的机器理论上应该有大约8倍亿次的FP64峰值计算,而已安装的计算基础也应该是实际的两倍。根据趋势,你可能需要超过10千万亿次浮点才能让机器进入名单。具有讽刺意味的是,随着高性能计算能力的提升,人工智能训练系统却在不断下降,计算量大幅增加,精度降低,这反而推动了人工智能性能的提升,远超预期。混合精度求解器可以填补这一空白,但目前尚不清楚有多少实际HPC应用在使用它们。


关键词: 超级计算机 HPC 算力性能 CPU-GPU 英伟达

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版