售价超25万元 NVIDIA最强显卡H100刷新AI跑分记录：近30倍领先--快科技--科技改变未来

正文内容 评论（0）

售价超25万元 NVIDIA最强显卡H100刷新AI跑分记录：近30倍领先

2023-06-28 09:54:25 出处：快科技作者：宪瑞编辑：宪瑞评论(0)

#NVIDIA #显卡

快科技6月28日消息，AI火爆之后，NVIDIA的显卡成为香饽饽，尤其是高端的H100加速卡，售价超过25万元依然供不应求，而它的性能也非常夸张，最新的AI测试中全面刷新记录，基于GPT-3的大语言模型训练任务纪录已经被刷至11分钟。

机器学习及人工智能领域开放产业联盟MLCommons公布了最新的MLPerf基准评测，其中包括8个负载测试，LLM大语言模型中就有基于GPT-3开源模型的，很考验平台的AI性能。

售价超25万元 NVIDIA最强显卡H100刷新AI跑分记录：近30倍领先

参与测试的NVIDIA平台由896个Intel至强8462Y+处理器和3584个H100加速卡组成，是所有平台中唯一跑完所有测试的，而且刷新了记录。

在关键的基于GPT-3的大语言模型训练任务中，H100平台只用了10.94分钟，可以对比的是Intel平台，由96个至强8380处理器和96个Habana Gaudi2 AI芯片构建的系统中，完成同样测试的时间为311.94分钟。

H100平台的性能几乎是30倍于Intel平台，当然两套平台的规模相差也很大，但只用768个H100加速卡的话，训练时间也只要45.6分钟，依然远超Intel平台的AI芯片。

H100基于GH100 GPU核心，定制版台积电4nm工艺制造，800晶体管，集成18432个CUDA核心、576个张量核心、60MB二级缓存，支持6144-bit HBM高带宽内存，支持PCIe 5.0。

H100计算卡有SXM、PCIe 5.0两种样式，其中SXM版本15872个CUDA核心、528个Tensor核心，PCIe 5.0版本14952个CUDA核心、456个Tensor核心，功耗最高达700W。

性能方面，FP64/FP32 60TFlops(每秒60万亿次)，FP16 2000TFlops(每秒2000万亿次)，TF32 1000TFlops(每秒1000万亿次)，都三倍于A100，FP8 4000TFlops(每秒4000万亿次)，六倍于A100。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：宪瑞

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#NVIDIA #显卡 #H100

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波