华为发布开源技术SINQ：可大幅降低大模型硬件需求！一张4090就能跑--快科技--科技改变未来

正文内容 评论（0）

华为发布开源技术SINQ：可大幅降低大模型硬件需求！一张4090就能跑

2025-10-05 23:43:46 出处：快科技作者：黑白编辑：黑白评论(0)

复制

纠错

#华为 #开源

快科技10月5日消息，据报道，华为苏黎世的实验室发布了一种新的开源量化方法，可在不牺牲大模型输出质量的情况下，减少显存需求。

该技术名为 SINQ（Sinkhorn-Normalized Quantization），目前已在GitHub和Hugging Face上开源，采用Apache 2.0许可，允许企业和研究机构免费使用、修改和商业部署。

SINQ的核心优势在于其快速、无需校准，并且易于集成到现有模型工作流中，通过独特的量化方法，将模型的显存需求降低了60%至70%，具体取决于模型架构和位宽。

这意味着原本需要超过60GB显存才能运行的模型，现在可以在大约20GB的环境中运行。原本需要在高端企业级GPU（如A100或H100）才能运行的大模型，如今可在更经济的硬件上运行，例如单张RTX 4090。

SINQ已在多种架构和模型（如Qwen3系列、LLaMA和DeepSeek）上进行了评估，并在WikiText2和C4等基准测试中表现出色，显著降低了困惑度和翻转率。

它还支持非均匀量化方案（如NF4），并可与校准方法（如AWQ）结合使用，进一步缩小与全精度模型的差距。

在运行效率方面，SINQ的量化速度比HQQ快约两倍，比AWQ快30倍以上，非常适合对量化时间有实际限制的研究和生产环境。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：黑白

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#华为 #开源 #大模型

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波