使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
主持人开场
开源 Agentic AI 生态解读
面向具身智能的高灵活大规模强化学习框架 RLinf
AReaL 2.0: Towards the Next-Generation Agentic RL Framework
茶歇 & 自由交流
百灵大模型在 RL 上的探索
Miles:面向企业场景的强化学习框架
圆桌论坛:Agentic AI Infra 生态发展
主持人开场
开源 Agentic AI 生态解读
面向具身智能的高灵活大规模强化学习框架 RLinf
AReaL 2.0: Towards the Next-Generation Agentic RL Framework
茶歇 & 自由交流
百灵大模型在 RL 上的探索
Miles:面向企业场景的强化学习框架
董仕目前就职于 RadixArk,主要从事强化学习模型训练以及 Miles 开源框架的开发工作。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。董仕于 2022 年获得斯坦福大学博士学位,博士期间主要研究方向为强化学习理论。
圆桌论坛:Agentic AI Infra 生态发展
董仕目前就职于 RadixArk,主要从事强化学习模型训练以及 Miles 开源框架的开发工作。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。董仕于 2022 年获得斯坦福大学博士学位,博士期间主要研究方向为强化学习理论。
🕕 5 月 23 日
📍杭州·蚂蚁 A 空间
蚂蚁开源技术沙龙以“开源 Agentic AI 的技术底座:RL 赋能的大模型与真实世界落地”为主题,邀请 RLinf、Miles、百灵、AReaL、ASystem 等社区一线技术专家,共同探讨 Agentic RL 的演进趋势和能力边界。
Agentic AI 的技术版图正飞速演变。哪些开源项目正在定义 Agentic RL 的技术底座?它们之间的能力边界在哪里?
蚂蚁开源联合 inclusionAI,将发布最新的 Agentic AI 生态全景图,为开发者提供一份兼具时效性和参考价值的技术导航图。
AReaL 是一个面向 Agent 的开源全异步强化学习训练框架。在 Agentic RL 算法系统协同创新的加持下,AReaL v1.0 可以兼容任意 Agent 框架。在本次沙龙中,项目 Co-Founder 和负责人杨统凯(子誉) 将提前揭晓 AReaL 2.0 新版本的进展与核心特性,描绘下一代 RL 训练基础设施的蓝图。
RLinf 是面向具身智能与 Agentic AI 的开源基础设施。RLinf 开源项目负责人、清华大学深圳国际研究生院助理教授于超将深入分享 RLinf 在真机强化学习、具身智能探索以及 Agentic AI 领域的最新挑战与系统设计思路。
近期,百灵大模型多个版本陆续开源。其中,Ring-2.6-1T 通过 Async RL 架构结合棒冰算法,提升万亿级模型长周期强化学习的训练效率与稳定性,为 Agent 能力和复杂推理能力提供底层支撑。百灵大模型团队成员、蚂蚁集团算法专家郭佳将分享百灵大模型在 RL 上的探索。
Miles 是面向大规模强化学习的训练框架,已被用于 MoE 模型训练。RadixArk Member of Technical Staff 董仕将带来本次分享。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。
在圆桌讨论中,子誉、于超、郭佳、董仕和 ASystem 团队负责人潘臻轩(泰初) 将围绕 Agentic AI Infra 生态展开观点碰撞。
除了干货演讲和圆桌的见解观点,百灵大模型、AReaL、OceanBase 等多个项目在现场设有展位供参会者深度交流。你可以:
和 AI 领域技术专家探讨技术难题,交流灵感;
和来自高校、行业的技术同好建立连接,探讨合作机遇;
直接与项目成员了解最新的技术进展;
董仕目前就职于 RadixArk,主要从事强化学习模型训练以及 Miles 开源框架的开发工作。加入 RadixArk 之前,他曾任 xAI 推理团队成员,参与 Grok 4、Grok 4.1 及 Grok 4.2 的核心研发,重点负责高质量强化学习训练数据的生成。董仕于 2022 年获得斯坦福大学博士学位,博士期间主要研究方向为强化学习理论。