全球超算TOP500：美国突破百亿亿次、中国笑而不语--快科技--科技改变未来

正文内容 评论（0）

全球超算TOP500：美国突破百亿亿次、中国笑而不语

2022-05-30 20:56:09 出处：芯智讯作者：浪客剑编辑：上方文Q 评论(0)

2022年5月30日，在德国汉堡举行的 ISC 2022公布了第59届的全球超算TOP500榜单，位于美国橡树岭国家实验室 (ORNL) 的新型超级计算机Frontier以绝对优势，成功超越日本的Fugaku，成为了全球最强超级计算机，同时也是全球首个真正的百亿亿次超级计算机。中国的神威·太湖之光和天河二号排名下滑至第六和第九。

百亿亿次超级计算机Frontier：性能最强，能效最高

据介绍，Frontier 在美国橡树岭国家实验室的计算设施 (OLCF) 占地 372 平方米，由 74 个 Cray EX 机柜组成，拥有 9,408 个节点，每个节点配备一个 AMD Milan “Trento” 7A53 Epyc CPU 和四个AMD Instinct MI250X GPU（GPU核心总数达到了37,632）。

每个节点通过 Hewlett Packard Enterprise（HPE）的 200 Gbit/秒的Slingshot-11 互连连接。

每个节点在 CPU 上运行 512GiB DDR4 内存，在整个节点上运行了 512GiB HMB2e（每个 GPU 128GiB）以及一致的内存。

[备注：1GiB=(1024*1024*1024)B=1073741824B

1GB(1000*1000*1000)B=1000000000B）]

整个Frontier 系统聚合了8730112个计算核心，9.2 PB 的内存（包括4.6 PB 的 DDR4 和 4.6 PB 的 HBM2e），37 PB 的节点本地存储，并可访问 716 PB 的中心范围存储。

凭借强大的硬件配置，Frontier在 Linpack 基准测试下达到了1.102 exaflops 的峰值实测性能，是排名第二的日本Fugaku性能（442 petaflops）的两倍，比TOP500榜单上第2至8名性能的总和还要高。

美国橡树岭国家实验室主任Thomas Zacharia 在昨天举行的媒体预先简报会上说：“1.1 exaflops的性能，很容易四舍五入而忽视这个0.1，但这个 0.1 代表了 100 petaflops的巨大性能。”

此外，TOP500榜单上还列出了Frontier的理论最大峰值速度 (rPeak)，但 HPE 和美国橡树岭国家实验室及其他相关者，希望进一步的进行优化，以将Frontier的理论峰值速度提高到 2 petaflops 的项目目标。

在这种情况下，Linpack 得分也将得到提高（Linpack 效率也可能提高，目前仅为 65.4%）在昨天举行的媒体简报会上，Thomas Zacharia也证实了这一消息。

更为值得一提的是，Frontier功耗仅为21,100KW，比排名第二的Fugaku的29,899KW功耗还要更低。同时，Frontier还以每瓦 52.23 gigaflops 的极高能效比，超过了日本的 Preferred Networks MN-3 系统，在 Green500 中也位居榜首。

“世界上最快的超算也是最节能的，这一事实简直令人惊叹。”Thomas Zacharia说到。

美国优势扩大，欧洲开始崛起，中国仍有望逆袭

在2021年5月底公布的全球TOP500超算榜单上，美国当时仅有四个超算系统位居前十榜单，分别排在第二、第三、第六和第七的位置。当时中国的神威·太湖之光和天河2号还占据了第四和第五名。

但是，时隔一年，随着美国百亿亿次超算Frontier的登顶，全球超算格局发生巨变，美国在超算领域的优势扩大，在前十榜单当中也已占据了一半。

全球超算TOP500：美国突破百亿亿次、中国笑而不语
△2021年5月底公布的全球TOP500超算前十榜单(图源：快科技)

最新的全球TOP500超算前十榜单(图源：快科技)

在最新的全球TOP500超算前十榜单上，除了排名第一的Frontier之外，美国橡树岭国家实验室Summit 在HPL 基准测试中，以 148.8 Pflop/s 的性能排名全球第四。

Summit 有 4,356 个节点，每个节点包含两个具有 22 个内核的IBM Power9 CPU内核和六个NVIDIA Tesla V100 GPU，每个都具有 80 个流式多处理器 (SM)。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。

位于美国加利福尼亚州劳伦斯利弗莫尔国家实验室的Sierra以94.6 Pflop/s的性能排名第 5。它的架构与Summit 非常相似。它由 4,320 个节点，每个节点两个IBM Power9 CPU 和四个 NVIDIA Tesla V100 GPU 构建而成。

此外，美国的超级计算机Perlmutter和Selene分别以64.6 Pflop/s和63.4 Pflop/s的性能，排名第7和第8。其中，Perlmutter基于 HPE Cray“Shasta”平台，以及一个具有基于 AMD EPYC 的节点和 1536 个 NVIDIA A100 加速节点的异构系统；Selene同样是基于AMD EPYC 处理器和NVIDIA A100节点。