正文内容 评论(0)
快科技3月2日消息,今年的春节档有多个国产AI大模型发布,但DeepSeek V4并没有如预期的那样问世,好消息是下周很有可能就正式发布了。
这个消息最初是英国FT金融时报报道的,援引的是消息人士,虽然不知道这些消息人士是否内部人员,但考虑到下周有全年最重磅的会议两会开幕,而且还是十五五计划开局,因此DeepSeek V4下周问世的消息还是很可信的。
去年春节档发布的DeepSeek R1给美国AI行业几大的震撼,当时NVIDIA的股价暴跌17%,虽然不全是DeepSeek的因素,但美国因此患上了DeepSeek恐惧症,生怕每次国产的开源AI发布就给美国AI一波冲击。
DeepSeek V4这次会带来哪些冲击?现在谁也不好说,美国CNBC做了个长达40分钟的视频内容——China next AI shock is hardware,中国下一次AI冲击是硬件,指出了DeepSeek V4发布之后将会冲击美国硬件行业。
实际上这也不是什么新闻了,DeepSeek之前的大模型还用了NVIDIA的AI卡训练,DeepSeek V4这一代显然会加大对国产AI芯片的支持,在国产芯片上完成训练、推理,并为多个国产AI芯片优化,目前可知的是华为昇腾及寒武纪的思元系列会有。

去年DeepSeek V3.1发布时,DeepSeek官方明确提到UE8M0 FP8是即将发布的下一代国产芯片设计。
之前国产AI芯片普遍就支持到FP16格式,部分AI可以软件支持到FP8,但显然不如原生FP8,后者相比FP16理论性能翻倍,对带宽的要求也大幅降低,有助于降低成本,毕竟之前传闻V4的成本只有对手的1/50。
国产AI芯片中目前最强的还是华为的昇腾系统,尤其是去年华为推出了超节点集群,路线图公布了昇腾Atlas 950 SuperPoD、Atlas 960 SuperPoD及Atlas 970 SuperPoD,今年问世的是Atlas 950系列。
Atlas 950超节点支持8192张基于Ascend 950DT的昇腾卡,是Atlas 900超节点的20多倍,
满配包括由128个计算柜、32个互联柜,共计160个机柜组成,占地面积1000平方米左右,柜间采用全光互联。
总算力大幅度提升,其中FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s,这个数字意味着Atlas 950一个产品的总互联带宽,已经超过今天全球互联网峰值带宽的10倍有余。
对比NVIDIA今年下半年发布的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。
即使是与NVIDIA计划2027年上市的 NVL576相比,Atlas 950超节点在各方面依然是领先的。

- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...
