使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
蚂蚁开源技术沙龙是由蚂蚁开源主办的系列开源技术分享与交流活动。在这里,蚂蚁开源携手他的伙伴们,与天南海北热爱开源的朋友相聚,畅谈开源技术与社区文化,为开发者、开源爱好者及社区伙伴们构筑一个开放、共享、协作的平台。
活动将聚焦开源技术生态的最新发展与实践,涵盖云原生、大数据、人工智能、大前端等核心领域,集结业内资深技术专家、开源社区核心贡献者和一线开发者,深挖技术创新与应用落地的前沿话题。通过技术分享、案例解析和深度互动,汇聚集体智慧,碰撞灵感火花,推动开源技术的普及与发展,助力社区的繁荣与成长。
王旭,蚂蚁集团开源技术委员会副主席蚂蚁开源技术增长团队 & 容器基础设施团队负责人
王旭目前负责蚂蚁的开源相关的整体战略和容器相关的基础设施的研发工作。在社区中,王旭代表蚂蚁担任开放基础设施基金会(OIF)的董事和木兰开源社区的技术委员会(TOC)成员。
在加入蚂蚁之前,王旭是开源安全容器创业公司 hyper.sh 的联合创始人与 CTO,他们和 Intel、OIF 一起于 2017 年在奥斯汀发起了 Kata Containers 项目,后者自2018年起成为 OIF 的一个顶级开源项目。
童雨轩,清华大学计算机系本科生,字节跳动 Seed-Infra 成员,verl 核心开发者,曾于清华大学知识工程实验(THUKEG)、香港科技大学自然语言处理实验室(HKUST-NLP)、卡耐基梅隆大学语言技术研究所(CMU-LTI)等机构实习。在 NeurIPS、ICLR、ICML 等国际会议发表论文 3 篇,谷歌学术引用量达 650。研究兴趣集中在自然语言处理、机器学习、强化学习等领域,致力于构建具备长上下文推理能力的人工智能系统。
史少锋,Datastrato VP of engineering,Apache 会员, Apache Incubator PMC, Mentor of Apache Gravitino, Gluten, HoraeDB 等多个项目; 专注于大数据分析和云计算技术。曾任 eBay 全球分析基础架构部大数据高级工程师,IBM 云计算部门架构师等。
程硕,OneHouse Hudi 开源工程师,多年大数据从业经验,曾在阿里云及字节跳动从事 Flink SQL 引擎和实时数据湖研发工作。
陈阳,2014 年发起成立开源社,也是中国开源年度报告,中国开源先锋 33 人,COSCon 中国开源年会的发起者。2004 年参与开源,曾任 GNOME 基金会 2010 董事总监,GNOME.Asia 社区创始人,Mozilla/Firfox 核心贡献者,GSoC 导师,2016 年任中国开源软件推进联盟副秘书长,开放原子开源基金会 TOC 导师。20 多年云计算和开源领域行业经验,目前在微软担任 Fabric 数据工厂首席产品经理,技术领域包括开源技术和社区治理、公有云、行业 AI 解决方案、知识图谱、Copilot、数据集成。2019 年获得美国人工智能专利一项, O'REILLY 《Beautiful Testing》联合作者。
姜宁,Apache 软件基金会董事、Apache Local Community (ALC) Beijing 发起人,字节跳动开源办公室首席布道师,前华为开源管理中心技术专家,前红帽软件首席软件工程师,有十五年以上企业级开源中间件开发经验,有丰富的 Java 开发和使用经验,函数式编程爱好者。
2025 大模型开源开发生态全景图发布
本演讲将发布《2025 年大模型开源开发生态全景图》,全面呈现当前迭代速度最快、创新最活跃的大模型开发技术生态。基于详实的数据观察,报告将深入解析模型训练框架、高效推理引擎及低代码应用开发等主导赛道的技术演进路径。从蚂蚁开源的视角,本报告希望通过洞察生态全景的方式了解行业中的最新动向与趋势发展,从而做开源社区的严肃用户和高质量的贡献者;从听众视角,本演讲旨在为开发者、企业及研究者提供全景视角,助力在快速变化的技术浪潮中把握方向。
圆桌讨论《重塑与重构:大模型时代下的技术生态演进》
本圆桌探讨大模型对传统技术领域的颠覆性影响,以及 Agent 工具与开发平台等新兴生态的崛起路径。邀请行业内的一线专家从不同视角展开观点碰撞,讨论将围绕几个话题展开:
· 大模型的发展给哪些技术领域带来了颠覆式影响?又有哪些新的技术生态涌现?
· 如何看待当下一波又一波昙花一现 AI 开源项目们,这种直播式短线开源模式必然不好吗?
· 以新兴生态的爆发对于软件开发协同模式带来怎样的影响,是否会加剧“超级个体”与“传统团队”的技术能力鸿沟?
Graph+AI:大模型浪潮下的图计算
图适合表达事物之间的关联关系,是一种超越平面的高维数据结构,可以帮助我们挖掘深层的数据价值。另一方面,图因为蕴含着事物之间的普遍联系,在数据的可解释性上有着天然的优势,因此可以认为是符号主义的典型代表。
源自连接主义的大语言模型的技术,是以数学概率为基础构建出来的,从而无法彻底规避推理幻觉问题。因此这也为 Graph + AI 技术结合带来了契机,即探索符号主义与连接主义的融合方法和研究。
本次分享将重点介绍蚂蚁图计算在「Graph+AI」技术方向的探索历程和关键成果,分享 Graph + AI 技术融合的未来系统架构形态,覆盖 GraphRAG、多智能体系统、图数据库和图计算系统内核设计等多方面内容。
Apache Gravitino: AI 时代的统一元数据平台
在 AI 时代,企业为构建高质量 AI 应用,需要使用更多数据,其中包括结构化数据(数据库、数据仓库等)、非结构化数据(数据湖、文档库、实时数据等);数据的完整性、合规等对构建 AI 的应用的起到了关键作用,这也就是元数据的价值。为 AI 用户提供一个统一的数据视图,供他们可以更好地发现和使用多源异构数据,包括数据发现、数据语义、数据血缘、数据权限等,并结合企业治理需求,管理好数据生命周期,避免资源浪费和安全问题等,成为每个企业的现实挑战。
Apache Gravitino (incubating) 应用而生,它提供统一的 API 来访问多种数据源以及多种数据存储、支持多种数据引擎和机器学习框架接入数据,并基于统一元数据实现统一命名、统一权限、统一血缘、统一审计等功能,从而大大简化了操作难度,打破了数据孤岛。目前已经在小米、Bilibili、唯品会、Pinterest、Uber 等公司进行了应用落地,收到良好效果。本次分享将为大家介绍 Gravitino 的背景、架构、核心功能以及成功案例,希望对大家有所帮助。
打造大模型数据湖仓——Apache Hudi 1.1 新特性解读
Hudi 在 2017 年就开创了事务型数据湖,逐渐演变为数据湖仓,成为该领域内关键的贡献。2024年末,Hudi 发布 1.0 版本,进入一个新的阶段。近期,Hudi 即将发布 1.1 版本。
本次分享主要给大家介绍 Apache Hudi 1.1 版本引入的大量新特性和性能优化,如何适配 AI 时代的开发与用户需求,以及未来社区规划。
面向未来的数据库:打造灵活高效的一体化产品体系
本次演讲将聚焦 OceanBase 以一体化架构突破传统数据库的局限,实现 TP(事务处理)、AP(分析处理)、KV(键值存储)、AI(人工智能) 的深度融合,打造高性能、高扩展、智能化的新一代数据库引擎。我们将深度解析 OceanBase 的多模一体化能力,包括:
· OLTP:从核心业务场景到多源业务场景,强化稳定性和安全性;
· OLAP:从实时数仓到湖仓一体的技术演进;
· SQL+AI:从一体化数据库到一体化的 AI 数据底座;
· 数据库多云原生共享存储架构:低成本、高可用、弹性伸缩。
veRL:灵活高效的大型语言模型强化学习训练框架
veRL 是当前最为流行的大型语言模型强化学习训练框架之一,其基于 HybridFlow 编程范式,兼顾了灵活性和效率,且经过了生产级别的大规模训练验证。本次分享将会介绍:
· HybridFlow 编程范式的设计与实现;
· veRL 推理阶段最新 feature 与优化技术;
· veRL 训练阶段最新 feature 与优化技术。
2025 大模型开源开发生态全景图发布
王旭,蚂蚁集团开源技术委员会副主席蚂蚁开源技术增长团队 & 容器基础设施团队负责人
王旭目前负责蚂蚁的开源相关的整体战略和容器相关的基础设施的研发工作。在社区中,王旭代表蚂蚁担任开放基础设施基金会(OIF)的董事和木兰开源社区的技术委员会(TOC)成员。
在加入蚂蚁之前,王旭是开源安全容器创业公司 hyper.sh 的联合创始人与 CTO,他们和 Intel、OIF 一起于 2017 年在奥斯汀发起了 Kata Containers 项目,后者自2018年起成为 OIF 的一个顶级开源项目。
圆桌讨论《重塑与重构:大模型时代下的技术生态演进》
陈阳,2014 年发起成立开源社,也是中国开源年度报告,中国开源先锋 33 人,COSCon 中国开源年会的发起者。2004 年参与开源,曾任 GNOME 基金会 2010 董事总监,GNOME.Asia 社区创始人,Mozilla/Firfox 核心贡献者,GSoC 导师,2016 年任中国开源软件推进联盟副秘书长,开放原子开源基金会 TOC 导师。20 多年云计算和开源领域行业经验,目前在微软担任 Fabric 数据工厂首席产品经理,技术领域包括开源技术和社区治理、公有云、行业 AI 解决方案、知识图谱、Copilot、数据集成。2019 年获得美国人工智能专利一项, O'REILLY 《Beautiful Testing》联合作者。
姜宁,Apache 软件基金会董事、Apache Local Community (ALC) Beijing 发起人,字节跳动开源办公室首席布道师,前华为开源管理中心技术专家,前红帽软件首席软件工程师,有十五年以上企业级开源中间件开发经验,有丰富的 Java 开发和使用经验,函数式编程爱好者。
王旭,蚂蚁集团开源技术委员会副主席蚂蚁开源技术增长团队 & 容器基础设施团队负责人
王旭目前负责蚂蚁的开源相关的整体战略和容器相关的基础设施的研发工作。在社区中,王旭代表蚂蚁担任开放基础设施基金会(OIF)的董事和木兰开源社区的技术委员会(TOC)成员。
在加入蚂蚁之前,王旭是开源安全容器创业公司 hyper.sh 的联合创始人与 CTO,他们和 Intel、OIF 一起于 2017 年在奥斯汀发起了 Kata Containers 项目,后者自2018年起成为 OIF 的一个顶级开源项目。
史少锋,Datastrato VP of engineering,Apache 会员, Apache Incubator PMC, Mentor of Apache Gravitino, Gluten, HoraeDB 等多个项目; 专注于大数据分析和云计算技术。曾任 eBay 全球分析基础架构部大数据高级工程师,IBM 云计算部门架构师等。
Graph+AI:大模型浪潮下的图计算
Apache Gravitino: AI 时代的统一元数据平台
史少锋,Datastrato VP of engineering,Apache 会员, Apache Incubator PMC, Mentor of Apache Gravitino, Gluten, HoraeDB 等多个项目; 专注于大数据分析和云计算技术。曾任 eBay 全球分析基础架构部大数据高级工程师,IBM 云计算部门架构师等。
打造大模型数据湖仓——Apache Hudi 1.1 新特性解读
程硕,OneHouse Hudi 开源工程师,多年大数据从业经验,曾在阿里云及字节跳动从事 Flink SQL 引擎和实时数据湖研发工作。
面向未来的数据库:打造灵活高效的一体化产品体系
veRL:灵活高效的大型语言模型强化学习训练框架
童雨轩,清华大学计算机系本科生,字节跳动 Seed-Infra 成员,verl 核心开发者,曾于清华大学知识工程实验(THUKEG)、香港科技大学自然语言处理实验室(HKUST-NLP)、卡耐基梅隆大学语言技术研究所(CMU-LTI)等机构实习。在 NeurIPS、ICLR、ICML 等国际会议发表论文 3 篇,谷歌学术引用量达 650。研究兴趣集中在自然语言处理、机器学习、强化学习等领域,致力于构建具备长上下文推理能力的人工智能系统。