正文内容 评论(0)
快科技12月11日消息,美国日前解禁了NVIDIA H200显卡的对华出口,这款显卡相对之前阉割版的H200大幅提升,对提升大模型训练推理能力很有帮助。
伴随H200解禁还有一个问题值得关注,那就是这款显卡使用的HBM3e显存是否也同样解禁了,可惜答案是否——美国对国内企业的HBM出口禁令依然存在,并不允许单独出售。
NVIDIA的H200显卡使用了上代的Hopper架构,FP32性能67TFLOPS,FP16性能高达1979TFLOPS,是H20显卡的6倍,同时也是全球首发HBM3e显存的,容量141GB,带宽高达4.8TB/s。
国内的AI显卡之前在用的还是HBM2e标准的,不论容量还是性能已经跟不上顶级AI模型的需求了。
不过HBM3e虽然还是不能出口,但华为已经有了自研的替代方案,今年9月份华为宣布自研了两种HBM,分别是HiBL 1.0和HiZQ 2.0,可根据不同的场景用于不同的AI显卡。
明年上半年的Ascend?950PR 采用了华为自研的低成本HBM技术HiBL 1.0,相比高性能、高价格的HBM3e/4e,能够大大降低推理Prefill阶段和推荐业务的投资。
明年下半年问世的Ascend 950DT采用了HiZQ 2.0,使内存容量达到144GB,内存访问带宽达到4TB/s。同时把互联带宽提升到了2TB/s。
未来的Ascend 960、Ascend 970还会进一步提升容量到288GB,带宽9.6TB/s、14.4TB/s,时间点在2027到2028年。
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...


