蚂蚁开源技术沙龙：开源 A

免费报名中

1270 人关注

时间 2026-05-23 14:00 ~ 18:00

地址浙江杭州市蚂蚁 A 空间 4 号楼 5 层报告厅

活动由蚂蚁开源 Ant Open Source 主办

大会倒计时：

天

时

分

秒

免费报名中

1270 人关注

微信分享

使用微信扫一扫分享到朋友圈

活动分享

使用微信扫一扫进入小程序分享活动

活动议程开源 Agentic AI 的技术底座：RL 赋能的大模型与真实世界落地

2026-05-23

14:00-14:10

主持人开场

主持人

夏小雅

蚂蚁开源技术增长团队开源生态洞察专家

2026-05-23

14:10-14:40

开源 Agentic AI 生态解读

嘉宾

王旭

蚂蚁集团开源技术委员会副主席、蚂蚁开源技术增长团队负责人

2026-05-23

14:40-15:10

面向具身智能的高灵活大规模强化学习框架 RLinf

嘉宾

于超

清华大学深圳国际研究生院助理教授、清华-智元机器人联合研究中心主任

2026-05-23

15:10-15:40

AReaL 2.0: Towards the Next-Generation Agentic RL Framework

嘉宾

杨统凯

AReaL 项目 Co-Founder & 负责人

2026-05-23

15:40-16:00

茶歇 & 自由交流

2026-05-23

16:00-16:30

百灵大模型在 RL 上的探索

嘉宾

郭佳(葭珥)

蚂蚁集团算法专家

2026-05-23

16:30-17:00

Miles：面向企业场景的强化学习框架

嘉宾

董仕

RadixArk Member of Technical Staff

2026-05-23

17:00-17:50

圆桌论坛：Agentic AI Infra 生态发展

嘉宾

潘臻轩(泰初)

蚂蚁集团 Asystem 团队负责人

杨统凯

AReaL 项目 Co-Founder & 负责人

于超

清华大学深圳国际研究生院助理教授、清华-智元机器人联合研究中心主任

郭佳(葭珥)

蚂蚁集团算法专家

董仕

RadixArk Member of Technical Staff

主持人开场

开源 Agentic AI 生态解读

王旭

蚂蚁集团开源技术委员会副主席、蚂蚁开源技术增长团队负责人

面向具身智能的高灵活大规模强化学习框架 RLinf

于超

清华大学深圳国际研究生院助理教授、清华-智元机器人联合研究中心主任

AReaL 2.0: Towards the Next-Generation Agentic RL Framework

杨统凯

AReaL 项目 Co-Founder & 负责人

茶歇 & 自由交流

百灵大模型在 RL 上的探索

郭佳(葭珥)

蚂蚁集团算法专家

Miles：面向企业场景的强化学习框架

董仕

RadixArk Member of Technical Staff

董仕目前就职于 RadixArk，主要从事强化学习模型训练以及 Miles 开源框架的开发工作。加入 RadixArk 之前，他曾任 xAI 推理团队成员，参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发，重点负责高质量强化学习训练数据的生成。董仕于 2022 年获得斯坦福大学博士学位，博士期间主要研究方向为强化学习理论。

圆桌论坛：Agentic AI Infra 生态发展

潘臻轩(泰初)

蚂蚁集团 Asystem 团队负责人

杨统凯

AReaL 项目 Co-Founder & 负责人

于超

清华大学深圳国际研究生院助理教授、清华-智元机器人联合研究中心主任

郭佳(葭珥)

蚂蚁集团算法专家

董仕

RadixArk Member of Technical Staff

活动详情

开源 Agentic AI 的技术底座：

RL 赋能的大模型与真实世界落地

🕕 5 月 23 日
📍杭州·蚂蚁 A 空间
蚂蚁开源技术沙龙以“开源 Agentic AI 的技术底座：RL 赋能的大模型与真实世界落地”为主题，邀请 RLinf、Miles、百灵、AReaL、ASystem 等社区一线技术专家，共同探讨 Agentic RL 的演进趋势和能力边界。

📈 Agentic AI 全景图谱发布，看清开源开发生态全貌

Agentic AI 的技术版图正飞速演变。哪些开源项目正在定义 Agentic RL 的技术底座？它们之间的能力边界在哪里？
蚂蚁开源联合 inclusionAI，将发布最新的 Agentic AI 生态全景图，为开发者提供一份兼具时效性和参考价值的技术导航图。

🎬AReaL 2.0 超前点映，解锁 RL 训练全新范式

AReaL 是一个面向 Agent 的开源全异步强化学习训练框架。在 Agentic RL 算法系统协同创新的加持下，AReaL v1.0 可以兼容任意 Agent 框架。在本次沙龙中，项目 Co-Founder 和负责人杨统凯(子誉) 将提前揭晓 AReaL 2.0 新版本的进展与核心特性，描绘下一代 RL 训练基础设施的蓝图。

⚙️RLinf——共探具身智能与 Agentic AI 新挑战

RLinf 是面向具身智能与 Agentic AI 的开源基础设施。RLinf 开源项目负责人、清华大学深圳国际研究生院助理教授于超将深入分享 RLinf 在真机强化学习、具身智能探索以及 Agentic AI 领域的最新挑战与系统设计思路。

🧠百灵大模型在 RL 上的探索

近期，百灵大模型多个版本陆续开源。其中，Ring-2.6-1T 通过 Async RL 架构结合棒冰算法，提升万亿级模型长周期强化学习的训练效率与稳定性，为 Agent 能力和复杂推理能力提供底层支撑。百灵大模型团队成员、蚂蚁集团算法专家郭佳将分享百灵大模型在 RL 上的探索。

📚Miles：面向企业场景的强化学习框架

Miles 是面向大规模强化学习的训练框架，已被用于 MoE 模型训练。RadixArk Member of Technical Staff 董仕将带来本次分享。加入 RadixArk 之前，他曾任 xAI 推理团队成员，参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发，重点负责高质量强化学习训练数据的生成。