AReaL v1.0稳定版来了！蚂蚁联合清华大学发布：让任意Agent跑上强化学习--快科技--科技改变未来

正文内容 评论（0）

AReaL v1.0稳定版来了！蚂蚁联合清华大学发布：让任意Agent跑上强化学习

2026-03-04 10:55:14 出处：快科技作者：黑白编辑：黑白评论(0)

复制

纠错

#Agent #智能体

快科技3月4日消息，今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版，主打Agent一键接入RL训练，不用改代码即可兼容各类Agent框架，让智能体强化学习训练开箱即用。

近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温，但是还存在两大痛点。

一是接入训练成本高，现有智能体框架接口各异，每接入一个往往需要编写整套适配代码；同时多数Agent能力受限于底层模型的固定权重，部署后无法针对特定场景持续优化。

而AReaL作为首个全异步训推解耦的大模型强化学习训练系统，让Agent能在真实任务交互中获取反馈、持续优化决策。

此次发布的v1.0版本，能让任意Agent零改造接入RL训练成为现实，通过在智能体与训练系统之间加入Proxy Worker中转层，开发者只需修改一个请求地址即可接入训练。

以OpenClaw为例，开发者仅需在配置文件中将base_url和api_key指向AReaL网关，即可让智能体接入强化学习训练。

用户周期性对任务完成质量打分，AReaL后台自动完成数据采集与模型更新，使智能体在使用过程中持续进化。

该版本还推出原生训练引擎Archon，基于PyTorch实现完整的5D并行（数据并行、流水线并行、张量并行、上下文并行、专家并行），便于在不同环境中灵活部署，能够支持千亿参数级MoE模型的分布式训练。

至于未来，将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代，目前AReaL v1.0的代码与文档已在inclusionAI社区开源。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：黑白

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#Agent #智能体 #AReaL v1.0

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波