正文内容 评论(0

AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习
2026-03-04 10:55:14  出处:快科技 作者:黑白 编辑:黑白     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技3月4日消息,今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打Agent一键接入RL训练,不用改代码即可兼容各类Agent框架,让智能体强化学习训练开箱即用。

近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温,但是还存在两大痛点。

一是接入训练成本高,现有智能体框架接口各异,每接入一个往往需要编写整套适配代码;同时多数Agent能力受限于底层模型的固定权重,部署后无法针对特定场景持续优化。

而AReaL作为首个全异步训推解耦的大模型强化学习训练系统,让Agent能在真实任务交互中获取反馈、持续优化决策。

AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习

此次发布的v1.0版本,能让任意Agent零改造接入RL训练成为现实,通过在智能体与训练系统之间加入Proxy Worker中转层,开发者只需修改一个请求地址即可接入训练。

以OpenClaw为例,开发者仅需在配置文件中将base_url和api_key指向AReaL网关,即可让智能体接入强化学习训练。

用户周期性对任务完成质量打分,AReaL后台自动完成数据采集与模型更新,使智能体在使用过程中持续进化。

AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习

该版本还推出原生训练引擎Archon,基于PyTorch实现完整的5D并行(数据并行、流水线并行、张量并行、上下文并行、专家并行),便于在不同环境中灵活部署,能够支持千亿参数级MoE模型的分布式训练。

至于未来,将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代,目前AReaL v1.0的代码与文档已在inclusionAI社区开源。

AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习

【本文结束】如需转载请务必注明出处:快科技

责任编辑:黑白

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...