正文内容 评论(0)
快科技6月3日消息,内存涨价让三星、SK海力士、美光等公司一年能赚十年的利润,他们的业绩是起飞了,但PC、显卡等行业可被害惨了,销量一落千丈。
NVIDIA如今也是内存芯片的最大客户之一了,只不过他们现在显然会优先保AI领域的显卡供应,游戏卡业务甚至都被归类到边缘计算业务了,连单独列出的资格都没有了。
前几天的ComputeX开幕演讲中,NVIDIA又推出了RTX Spark这种全新的PC产品,定位本地AI算力平台,能支持128GB内存,这又会加剧对内存的需求。
那NVIDIA会怎么解决RTX Spark及GeForce显卡业务的内存供应问题呢?在发布会的采访中,黄仁勋也回应了这个问题,答案倒是非常简洁——将使用AI技术来减少内存使用量。
至于具体怎么实现,这个问答中没有提及,黄仁勋可能就是那么套路性地回应一下。
但是用AI降低显存用量在技术上也是有可能的,今年初NVIDIA就有过尝试了,不仅要重启RTX 30系列显卡生产,还要把NVFP4算法下放到以前的平台。
相比FP16、FP8,FP4算法标准能够大幅提升性能,降低显存用量,NVFP4是NVIDIA自己优化的标准,但在Blackwell显卡上才是原生支持,RTX 30/40显卡可以靠软件算法支持,性能不如原生那么好。

给RTX显卡增加FP4支持之后,表现如何呢?NVIDIA自己公布了一些数据,不同AI中性能提升不同,少的只有30-40%提升,多的翻倍提升,而在Qwen Image中,性能最高提升了360%。

不仅性能暴涨,FP4还会大幅降低显存占用,Flux.1中显存占用从23GB减少到了9GB,Flux.2中从87GB直接降低到了26GB,Qwen Image中也从40GB降低到了18GB,总体上就是少则降低一半,多则可以减少2/3显存占用。
当然,以上的测试是针对AI应用的,FP4理论上也能用于渲染,NVIDIA之前不是推出了DLSS 5吗,就是用AI技术来渲染游戏帧,只不过面临的争议比较大,后续怎么推、会不会下放给RTX 30系列显卡就不确定了。

- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...
