微信分享
蚂蚁开源技术沙龙:开源 A

使用微信扫一扫分享到朋友圈

活动分享
蚂蚁开源技术沙龙:开源 A

使用微信扫一扫进入小程序分享活动

活动议程 开源 Agentic AI 的技术底座:RL 赋能的大模型与真实世界落地
2026-05-23
2026-05-23
14:00-14:10

主持人开场    

主持人
蚂蚁开源技术沙龙:开源 A
夏小雅
蚂蚁开源技术增长团队开源生态洞察专家
2026-05-23
14:10-14:40

开源 Agentic AI 生态解读

嘉宾
蚂蚁开源技术沙龙:开源 A
王旭
蚂蚁集团开源技术委员会副主席、蚂蚁开源技术增长团队负责人
2026-05-23
14:40-15:10

面向具身智能的高灵活大规模强化学习框架 RLinf    

嘉宾
蚂蚁开源技术沙龙:开源 A
于超
清华大学深圳国际研究生院 助理教授、清华-智元机器人联合研究中心主任
2026-05-23
15:10-15:40

AReaL 2.0: Towards the Next-Generation Agentic RL Framework    


嘉宾
蚂蚁开源技术沙龙:开源 A
杨统凯
AReaL 项目 Co-Founder & 负责人
2026-05-23
15:40-16:00

茶歇 & 自由交流    

2026-05-23
16:00-16:30

百灵大模型在 RL 上的探索    

嘉宾
蚂蚁开源技术沙龙:开源 A
郭佳(葭珥)
蚂蚁集团 算法专家
2026-05-23
16:30-17:00

Miles:面向企业场景的强化学习框架

嘉宾
蚂蚁开源技术沙龙:开源 A
董仕
RadixArk Member of Technical Staff
2026-05-23
17:00-17:50

圆桌论坛:Agentic AI Infra 生态发展

嘉宾
蚂蚁开源技术沙龙:开源 A
潘臻轩(泰初)
蚂蚁集团 Asystem 团队负责人
蚂蚁开源技术沙龙:开源 A
杨统凯
AReaL 项目 Co-Founder & 负责人
蚂蚁开源技术沙龙:开源 A
于超
清华大学深圳国际研究生院 助理教授、清华-智元机器人联合研究中心主任
蚂蚁开源技术沙龙:开源 A
郭佳(葭珥)
蚂蚁集团 算法专家
蚂蚁开源技术沙龙:开源 A
董仕
RadixArk Member of Technical Staff

主持人开场    

开源 Agentic AI 生态解读

蚂蚁开源技术沙龙:开源 A
王旭
蚂蚁集团开源技术委员会副主席、蚂蚁开源技术增长团队负责人

面向具身智能的高灵活大规模强化学习框架 RLinf    

蚂蚁开源技术沙龙:开源 A
于超
清华大学深圳国际研究生院 助理教授、清华-智元机器人联合研究中心主任

AReaL 2.0: Towards the Next-Generation Agentic RL Framework    


蚂蚁开源技术沙龙:开源 A
杨统凯
AReaL 项目 Co-Founder & 负责人

茶歇 & 自由交流    

百灵大模型在 RL 上的探索    

蚂蚁开源技术沙龙:开源 A
郭佳(葭珥)
蚂蚁集团 算法专家

Miles:面向企业场景的强化学习框架

蚂蚁开源技术沙龙:开源 A
董仕
RadixArk Member of Technical Staff

董仕目前就职于 RadixArk,主要从事强化学习模型训练以及 Miles 开源框架的开发工作。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。董仕于 2022 年获得斯坦福大学博士学位,博士期间主要研究方向为强化学习理论。

圆桌论坛:Agentic AI Infra 生态发展

蚂蚁开源技术沙龙:开源 A
潘臻轩(泰初)
蚂蚁集团 Asystem 团队负责人
蚂蚁开源技术沙龙:开源 A
杨统凯
AReaL 项目 Co-Founder & 负责人
蚂蚁开源技术沙龙:开源 A
于超
清华大学深圳国际研究生院 助理教授、清华-智元机器人联合研究中心主任
蚂蚁开源技术沙龙:开源 A
郭佳(葭珥)
蚂蚁集团 算法专家
蚂蚁开源技术沙龙:开源 A
董仕
RadixArk Member of Technical Staff

董仕目前就职于 RadixArk,主要从事强化学习模型训练以及 Miles 开源框架的开发工作。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。董仕于 2022 年获得斯坦福大学博士学位,博士期间主要研究方向为强化学习理论。

活动详情

开源 Agentic AI 的技术底座:

RL 赋能的大模型与真实世界落地

🕕 5 月 23 日
📍杭州·蚂蚁 A 空间

蚂蚁开源技术沙龙以“开源 Agentic AI 的技术底座:RL 赋能的大模型与真实世界落地”为主题,邀请 RLinf、Miles、百灵、AReaL、ASystem 等社区一线技术专家,共同探讨 Agentic RL 的演进趋势和能力边界。

📈 Agentic AI 全景图谱发布,看清开源开发生态全貌

Agentic AI 的技术版图正飞速演变。哪些开源项目正在定义 Agentic RL 的技术底座?它们之间的能力边界在哪里?
蚂蚁开源联合 inclusionAI,将发布最新的 Agentic AI 生态全景图,为开发者提供一份兼具时效性和参考价值的技术导航图。

🎬AReaL 2.0 超前点映,解锁 RL 训练全新范式

AReaL 是一个面向 Agent 的开源全异步强化学习训练框架。在 Agentic RL 算法系统协同创新的加持下,AReaL v1.0 可以兼容任意 Agent 框架。在本次沙龙中,项目 Co-Founder 和负责人杨统凯(子誉) 将提前揭晓 AReaL 2.0 新版本的进展与核心特性,描绘下一代 RL 训练基础设施的蓝图。

⚙️RLinf——共探具身智能与 Agentic AI 新挑战

RLinf 是面向具身智能与 Agentic AI 的开源基础设施。RLinf 开源项目负责人、清华大学深圳国际研究生院助理教授于超将深入分享 RLinf 在真机强化学习、具身智能探索以及 Agentic AI 领域的最新挑战与系统设计思路。

🧠百灵大模型在 RL 上的探索

近期,百灵大模型多个版本陆续开源。其中,Ring-2.6-1T 通过 Async RL 架构结合棒冰算法,提升万亿级模型长周期强化学习的训练效率与稳定性,为 Agent 能力和复杂推理能力提供底层支撑。百灵大模型团队成员、蚂蚁集团算法专家郭佳将分享百灵大模型在 RL 上的探索。

📚Miles:面向企业场景的强化学习框架

Miles 是面向大规模强化学习的训练框架,已被用于 MoE 模型训练。RadixArk Member of Technical Staff 董仕将带来本次分享。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。

💥圆桌讨论,一线技术专家的观点碰撞——AI Infra 将如何演进

在圆桌讨论中,子誉、于超、郭佳、董仕和 ASystem 团队负责人潘臻轩(泰初) 将围绕 Agentic AI Infra 生态展开观点碰撞。

演讲 + 圆桌 + 展位,边听边聊

除了干货演讲和圆桌的见解观点,百灵大模型、AReaL、OceanBase 等多个项目在现场设有展位供参会者深度交流。你可以:

  • 和 AI 领域技术专家探讨技术难题,交流灵感;

  • 和来自高校、行业的技术同好建立连接,探讨合作机遇;

  • 直接与项目成员了解最新的技术进展;


活动主办方