正文内容 评论(0

全球首个混合线性架构万亿参数思考模型开源:长文本推理效率提升3倍 获IMO金牌
2026-02-13 12:33:20  出处:快科技 作者:秋白 编辑:秋白     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技2月13日消息,今日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。

在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。

在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。

同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理,支持多步规划与工具调用。

全球首个混合线性架构万亿参数思考模型开源:长文本推理效率提升3倍 获IMO金牌

在多项权威基准测试中,Ring-2.5-1T 与 DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking 等主流开源与闭源模型进行了系统对比,在数学推理、代码生成、逻辑推理和智能体任务执行等高难场景中达到开源领先水平。尤其在深度思考(Heavy Thinking)模式下,该模型在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型,展现了强大的复杂推理与跨任务泛化能力。

全球首个混合线性架构万亿参数思考模型开源:长文本推理效率提升3倍 获IMO金牌

据了解,Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。

与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。

具体开源仓库和体验页面如下(可点击前往)

Hugging Face:

https://huggingface.co/inclusionAI/Ring-2.5-1T-FP8

ModelScope:

https://modelscope.cn/models/inclusionAI/Ring-2.5-1T-FP8

全球首个混合线性架构万亿参数思考模型开源:长文本推理效率提升3倍 获IMO金牌

【本文结束】如需转载请务必注明出处:快科技

责任编辑:秋白

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...