正文内容 评论(0

里程碑时刻!蚂蚁推出业内首个100B扩散语言模型
2025-12-12 19:19:47  出处:快科技 作者:鹿角 编辑:鹿角     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技12月12日消息,“蚂蚁开源”公众号发文,蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。

这一发布打破了行业对扩散模型难以扩展的固有认知,实现了参数规模与性能的双重重大突破。

LLaDA2.0系列包含基于MoE架构的16B (mini) 和里程碑式的100B (flash) 两个版本,首次将扩散模型的参数规模成功扩展至百亿量级。

里程碑时刻!蚂蚁推出业内首个100B扩散语言模型

尤为引人注目的是,该模型在代码、数学及智能体任务上的性能超越了同级别的自回归(AR)模型。

通过蚂蚁创新的Warmup-Stable-Decay (WSD) 持续预训练策略,LLaDA2.0能够高效继承现有AR模型的知识储备,显著避免了从头训练的巨大成本。

在训练优化方面,LLaDA2.0结合了置信度感知并行训练(CAP)和扩散模型版DPO,不仅保障了生成质量,更充分发挥了扩散模型并行解码的先天优势。最终,模型实现了相比AR模型高达2.1倍的推理加速。

LLaDA2.0的成功有力证明:在超大规模参数下,扩散模型不仅完全可行,更能展现出比传统自回归模型更强的性能与更快的速度。

里程碑时刻!蚂蚁推出业内首个100B扩散语言模型

【本文结束】如需转载请务必注明出处:快科技

责任编辑:鹿角

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#蚂蚁#模型#开源

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...