正文内容 评论(0

业界首个!美团发布LongCat-2.0:总参数规模1.6万亿 全程由国产算力训练
2026-06-30 11:41:46  出处:快科技 作者:哈尔 编辑:哈尔     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技6月30日消息,今日,美团发布新一代万亿参数大模型LongCat-2.0,并将对外开源。

据介绍,LongCat-2.0是业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型,总参数规模1.6万亿,从零开始预训练,原生支持1M超长上下文。

此前,该大模型的测试版本在OpenRouter上的总调用量已跻身全球前三。

其中在Hermes的月调用量位列全球第一,在Claude Code的月调用量位列全球第二,仅次于Claude Opus 4.8。

LongCat官方宣布,将于近期开源Infra框架、推理引擎、模型参数等核心技术,以回馈全球开发者社区。

业界首个!美团发布LongCat-2.0:总参数规模1.6万亿 全程由国产算力训练

据悉,LongCat-2.0预训练数据规模超过30T tokens,覆盖中文、英文、多语言和代码等多类数据。

面对万卡级训练中的硬件故障、通信异常、显存压力与数值波动,LongCat团队从稳定性、正确性和效率三方面攻克国产算力训练难题。

在稳定性上,通过HCCL异常处理、弹性扩缩卡和自动故障恢复,将月均日故障率降低70%以上。

在正确性上,通过自研设计确定性算子、Bitwise一致性验证和参数检测,保障训练结果的可靠,同时基于实践提升关键模块计算精度、优化Reduce逻辑。

在效率上,通过流水线调度、显存优化和算子级控核,训练MFU提升1.5倍。

最终,LongCat实现稳态日吞吐超过1T tokens/day,完成万亿参数MoE模型在国产算力上的稳定训练。

业界首个!美团发布LongCat-2.0:总参数规模1.6万亿 全程由国产算力训练

【本文结束】如需转载请务必注明出处:快科技

责任编辑:哈尔

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...