老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1--快科技--科技改变未来

正文内容 评论（0）

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

2025-03-07 18:28:31 出处：快科技作者：黑白编辑：黑白评论(0)

快科技3月7日消息，日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化，让DeepSeek R1可以在如A100等老型号GPU上进行部署。

据介绍，DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本，但原生版本的模型权重为FP8数据格式，对GPU芯片类型有严格限制，仅能被英伟达新型GPU支持（如Ada、Hopper架构芯片），其他型号GPU（如A100）无法直接部署。

虽然可以将FP8权重反量化为BF16权重后，在A100等GPU上进行推理，但是这对显存的要求提升了一倍，推理吞吐也会下降。

为此美团搜索和推荐平台部对DeepSeek R1模型进行了INT8精度量化尝试，发现使用INT8量化后模型精度基本无损。

基于INT8量化，DeepSeek R1模型解锁了芯片限制，可以部署到A100等其他型号GPU；并且相比BF16实现了50%的吞吐提升，进一步降低了推理成本。

目前量化代码已经发布在了开源LLM推理框架SGLang上，量化模型已经发布到了Hugging Face社区：

https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

对具体过程感兴趣的，可以查看官方技术报告。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：黑白

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#显卡 #美团 #DeepSeek

好物推荐

换一波

三全鲜肉蜜枣粽子4只到手仅9.9元：软糯清香
2025-04-18 1
买1得2：爱奇艺黄金会员年卡+京东PLUS年卡158元发车
2025-04-19 7
康巴赫家用实木菜板44元起售：双面可用抗菌耐用
2025-04-17 3

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

今日视点

2025年04月21日星期一

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

三全鲜肉蜜枣粽子4只到手仅9.9元：软糯清香

买1得2：爱奇艺黄金会员年卡+京东PLUS年卡158元发车

康巴赫家用实木菜板44元起售：双面可用抗菌耐用

俄罗斯原装进口：爱莲巧纯可可脂黑巧6.6元抄底入

《黑神话：悟空》衍生“影神图”实体书发售：99元附赠三件

莫代尔/高弹莱卡棉：法国梦特娇纯色短袖礼盒59元狂促

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

三全鲜肉蜜枣粽子4只到手仅9.9元：软糯清香

买1得2：爱奇艺黄金会员年卡+京东PLUS年卡158元发车

康巴赫家用实木菜板44元起售：双面可用 抗菌耐用

俄罗斯原装进口：爱莲巧纯可可脂黑巧6.6元抄底入

《黑神话：悟空》衍生“影神图”实体书发售：99元附赠三件

莫代尔/高弹莱卡棉：法国梦特娇纯色短袖礼盒59元狂促

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波

康巴赫家用实木菜板44元起售：双面可用抗菌耐用