使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2 天沉浸式学习交流 | 8+前沿分论坛 | 32+真实应用案例
2022 年底,ChatGPT 刚把“对话”卷到天花板,工程师还没来得及鼓掌,投资人已经在问:它能不能动手?
六个月后,Plugins 出现,“大模型 + 工具”被写进无数 BP,可真正上到生产线的屈指可数——不是模型不行,是工程、成本、合规三座大山同时压下来。
又过了两个季度,Manus横空出世惊艳全球,2025年正式成为Agent元年。围绕Agent技术和生态的迭代进入加速期,128 k 长窗口、Multi-Agent 框架、MCP、A2A等像连珠炮一样此起彼伏,行业共识瞬间形成:谁先把 Agent 塞进核心系统,谁就能拿下下一代应用入口。
共识来得太快,踩坑却太碎——GPU/CPU 怎么切、RAG 还值不值得、工具失败率到底卡几位 9、长窗口成本曲线何时打平,每一题都直击上线节点。
于是我们把 18 个月的惊险冲刺浓缩成两天:不谈愿景,只交付能复制、可回滚、可量化的硬核方案,让工程师在下一个版本冻结前,把 Agent 从 Demo 搬进生产核心。
多年 IT、互联网工作经验,在基础平台架构与研发、金融分布式系统、金融科技探索与应用方面有丰富经验。负责度小满整体技术的规划与推进,以及信贷技术架构从1.0到4.0的演进,支持了业务多年数倍的持续增长。
在金融科技探索上,主导了区块链、复杂工程技术、虚拟现实、物联网技术、LLM的探索与应用落地;从0组建了百度第1个区块链研发团队,相关工作荣获了福布斯全球、哈佛商业评论、工信部等国内国际荣誉。推动与参与了多项国内国际标准的制定,以及白皮书、蓝皮书的攥写,个人累计申请了60多项国际、国内发明专利。
胡云华,西安交通大学和微软亚洲研究院联合培养博士,先后担任微软亚洲研究院副研究员、阿里巴巴达摩院资深算法专家、支付宝中国首席数据官、智谱华章副总裁,在搜索、广告、推荐、大模型研发、用户产品创新方面拥有丰富经验。
阿里云EMR研发团队负责人,资深技术专家,Apache Flink & HBase PMC Member,Apache软件基金会Member。
13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。
具有多年在传统数据库管理和大数据分布式平台开发与维护的专业背景。熟练掌握大数据技术,能够高效地进行批处理和流处理任务的设计和实施。对数据湖架构的构建和优化也有深入研究,能够帮助企业从海量数据中提取有价值的信息,支持数据驱动的决策制定。
目前在eBay作为数据平台研发总监,带领团队负责云原生的数据湖,分布式搜索引擎,调度系统,存算分离计算引擎,OLAP离线数据库,数据开发平台等技术的实施,优化,开发工作。
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
美的集团首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow IET Fellow ACM Distinguished Scientist。
吴友政博士,京东科技集团语音语义算法部负责人、高级总监。博士毕业于中国科学院自动化研究所,毕业后在日本情报通信研究机构、英国爱丁堡大学、索尼中国研究院和爱奇艺负责自然语言处理、语音识别、机器翻译等前沿技术研究和产品研发工作,在国际自然语言处理顶会和期刊(如ACL、NAACL、EMNLP、AAAI、ICASSP等)上发表多篇学术论文。曾获得语音识别(IWSLT2012、IWSLT2013)和对话式机器阅读理解(QuAC 2020)比赛的冠军。连续2年主办京东人机对话挑战赛。技术产品化上,带领团队打造了基于多轮对话技术的智能客服平台言犀、基于多模态内容生成技术的品创等产品。曾获得京东集团技术金牛奖等荣誉。
企业架构和数字化转型专家,北京大学理学硕士,银行、保险、车企20年工作经验,《企业架构驱动数字化转型》作者,“金融IT那些事儿”公众号主理人。
阿里云AI搜索研发负责人,负责阿里云AI搜索产品OpenSearch、阿里云ElasticSearch AI研发,以及开源搜索引擎Havenask研发。覆盖AI搜索、向量检索、大数据检索、对话式搜索等多个场景。带领团队研发多款搜索、推荐和智能问答类产品研发。目前主要聚焦在大模型AI搜索研发,关注大模型AI搜索对业务和客户的价值。
AI数据生产(标注、数据集、合成)、AI安全(评测、防御)、AI软硬件一体、AI营销相关领域从业者。
企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。
阅文集团技术副总经理,AIGC负责人,腾讯云最具价值专家、复旦大学计算机学院专业硕士导师。有着近15年的人工智能、大数据研发管理经验。在AIGC、个性化推荐、搜索、大数据挖掘、自然语言处理等领域都有丰富的实践经验。目前主导人工智能技术在集团内部的研发和应用落地,带领团队研发了阅文妙笔大模型和多模态大模型,并在作家辅助创作、角色对话、增长素材和机器翻译等大模型应用场景上也取得了不错的成果。对内容业务有深刻理解,也主导推进智能风控、推荐系统、反盗版等公司重点项目落地。曾任百度人工智能事业部技术经理,负责过百度推荐、精准广告、图片搜索、大数据商业化等项目。
胡月军,现任 ProtonBase 技术副总裁,从事存储与计算引擎的设计与研发工作,致力于打造 AI 时代云原生一体化的数据存储,计算和管理系统。曾任阿里巴巴计算平台事业部资深技术专家,发起和参与了阿里巴巴交互式分析引擎 Hologres 的研发。在此之前,从事5年搜索和广告引擎的设计与开发,负责过阿里巴巴淘宝、天猫、1688、Sourcing 和 AliExress 的搜索与广告在线引擎系统,主导过阿里巴巴国际搜索和广告引擎在离线的一体化升级改造。
Agent Foundation Model | Agent Dev Tool | 面向 Agent 的数据工程系统 |
|
|
|
面向 Agent 的记忆工程 | Agent 可信治理 | AgentOS内核与落地实战 |
|
|
|
DataAgent | 专业助手Agent | 自主决策Agent |
|
|
|
中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注AI技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。
毕业于中国科学技术大学,获得计算机科学博士学位。随后加入理光研究院,并在亚利桑那州立大学(ASU)担任博士后研究员。2014年回国加入阿里巴巴,历任蚂蚁集团风控科技总监。现为蚂蚁数字科技AI技术负责人。
清华大学经管学院 MBA,西安电子科技大学计算机系本科。2014 年创办宜创科技,目前已服务国内上百家大型技术团队和项目。宜创科技 2023 年开始专注在基于大模型 AGI 领域创新,已推出 ChatBI、ChatExcel、ChatPDF 等多个产品。目前,宜创科技正在构建全新的大模型中间层基 LLMFarm,个人智能助理 FriAI ,致力于帮助企业解决不能用、不会用、不好用的大模型开发的实际痛点,让中国企业都能以十分之一成本,利用 LLM 大模型落地各行业应用场景。
熊飞宇,华中科技大学本科,美国 Drexel University博士,上海算法创新研究院大模型中心负责人。长期专注于基本原理驱动的系统性创新,以“低成本、低幻觉、高泛化”为核心,探索适合中国国情的大模型发展和AI应用落地的新路径。自主研发基于记忆分层架构的“忆3”和记忆操作系统 MemOS,已实现商业化落地,业绩稳健增长,获得招商证券、中国银行、中国电信等头部国央企认可。曾任阿里巴巴集团业务中台数据智能负责人、淘宝天猫集团数据平台负责人,成功构建国内首个千亿级数字商业知识图谱及知识交互的零售行业大模型,荣获浙江省科技进步奖等多个奖项,并在人工智能顶级会议和期刊发表多篇学术论文。
蚂蚁财富投研支小助技术负责人、AntAlpha 投研量化平台技术负责人。曾任 DecentGalaxy 量化基金技术合伙人、青岛基金协会特邀专家、中国海洋大学社会讲师。长期致力于经典量化投研、人工智能算法、大模型多智能体技术与金融研究的有机结合与平台化探索。
李国良,清华大学教授,计算机系副主任,博士生导师,国家杰出青年科学基金获得者,IEEE Fellow,openGauss 社区技术委员会主席。在数据库领域顶级会议和期刊上发表论文200余篇,他引18000余次,入选爱思唯尔2014-2024年中国高被引学者榜单。主持国家杰出青年基金、优秀青年基金、青年973、自然基金重点等项目。获得了VLDB 2017 Early Career Research Contributions Award(VLDB青年贡献奖,亚洲首位获奖者)、IEEE TCDE Early Career Award(IEEE 数据工程领域杰出新人奖,亚洲首位获奖者)、青年长江学者、“万人计划”青年拔尖、计算机学会青年科学家奖、教育部新世纪优秀人才等奖项。担任VLDB Journal、IEEE TKDE等编委,SIGMOD 2021大会主席,VLDB 2021 Demo 主席,ICDE 2022 Industry Chair, 多次担任SIGMOD、VLDB、KDD、ICDE、WWW、IJCAI、AAAI等会议的程序委员会委员。获得过数据库领域重要国际会议SIGMOD23、VLDB23、VLDB20、KDD18、ICDE18最佳论文提名,VLDB23工业界最佳论文亚军,SIGMOD24 研究亮点奖,DASFAA23最佳论文、CIKM’17的最佳论文奖、DASFAA’14的最佳论文提名奖、APWeb’14最佳论文奖、EDBT’13大数据比赛冠军。获国家科技进步二等奖(2018)、江苏省科技进步一等奖(2019)、电子学会科技进步一等奖(2022)、CCF科技进步特等奖(2022)。
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
杨玉庆博士现任微软亚洲研究院首席研发经理,负责领导上海系统组,专注于大模型系统与智能体系统的研究工作。他的研究兴趣包括大规模语言模型的高效计算与推理,尤其关注长上下文模型的推理加速;以及智能体的系统设计与优化,包括面向智能体的系统调度优化、多轮强化学习系统与算法等。他的相关研究成果已多次发表在OSDI、SOSP、EuroSys、ATC、CVPR、ICCV、NeurIPS等国际顶级学术会议上。杨玉庆博士于2006年和2011年分别获得复旦大学学士与博士学位。
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
姜大昕博士是自然语言处理领域的全球知名专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验。姜大昕博士曾担任微软全球副总裁,微软亚洲互联网工程院副院长、首席科学家。2023 年,姜大昕博士创立上海阶跃星辰智能科技有限公司,致力于实现通用人工智能(AGI)。
邓亚峰,毕业于清华大学,正高级工程师,拥有二十余年人工智能算法及产品研发经验。现任EverMind CEO 兼 盛大集团副总裁。曾任360集团副总裁、人工智能研究院院长兼搜索事业部总经理,科创板首家AI上市公司格灵深瞳CTO。荣获2021年中国人工智能年度十大风云人物,教育部技术发明奖二等奖。长期致力于大语言模型、计算机视觉及AI for Science等领域的研究与应用,带领团队多次在国际国内主流AI评测中获得佳绩;累计申请发明专利160余项(已授权98项),发表论文50余篇(含10篇Nature子刊)。
分布式系统专家,架构师,开源软件作者,知名开源 HTAP 数据库 TiDB 主要作者,曾就职于微软亚洲研究院,网易有道及豌豆荚。2015 年创业,成立 PingCAP,致力于下一代开源分布式数据库的研发工作,擅长分布式存储系统设计与实现,高并发后端架构设计。曾多次在 VLDB,HPTS 等数据库学术会议上发表论文或进行主题分享。作为第一作者在 VLDB 2020 发表论文《TiDB, A Raft-based HTAP Database》。
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
北京大学心理与认知科学学院硕士行业导师,北邮101拔尖班企业导师,CCF YOSCEF总部学术委员,CCF大模型论坛执委,微软小冰初创成员。研究方向:人机对话、大语言模型和AI Agent。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,主导了小米MiLM系列基座模型训练。曾获23年小米百万美金技术大奖,24年CCF计算机应用创新技术一等奖,24年数博会优秀科技成果奖等,在国际顶级学术会议和杂志发表论文30余篇。
缪旭博士,九章云极DataCanvas公司AI首席科学家,是人工智能领域的杰出布道师。
毕业于华盛顿大学,拥有超过二十年的AI研究与管理经验,长期深耕于AI技术的实现与应用,特别是在AI人机交互方式的探索与落地方面,取得了卓越成就。
学术造诣深厚,在ACM SIG KDD、IJCAI、IJCV、NeurIPS及Neural Computation等国际顶级期刊与会议上,发表多篇具有影响力的学术论文,并拥有授权美国发明专利10余项。不仅展现其在AI领域的深厚底蕴和卓越创新精神,更为AI技术的发展和应用提供了有力支撑。
曾在微软研究院和LinkedIn等国际知名企业担任研究员等重要职务,曾成功创办Astound.ai、Reasoned.ai等多家高科技公司,专注于将可推理可解释的人工智能、大模型、大规模实时机器学习、情感计算等前沿AI技术加速应用于各行各业,推动AI技术的商业化进程。
于2023年入选国家启明计划,目前作为九章云极DataCanvas的AI首席科学家,继续引领公司在AI技术的研发与应用方面不断突破,为推动AI技术的创新与发展贡献力量。
清华大学经管学院 MBA,西安电子科技大学计算机系本科。2014 年创办宜创科技,目前已服务国内上百家大型技术团队和项目。宜创科技 2023 年开始专注在基于大模型 AGI 领域创新,已推出 ChatBI、ChatExcel、ChatPDF 等多个产品。目前,宜创科技正在构建全新的大模型中间层基 LLMFarm,个人智能助理 FriAI ,致力于帮助企业解决不能用、不会用、不好用的大模型开发的实际痛点,让中国企业都能以十分之一成本,利用 LLM 大模型落地各行业应用场景。
10年+的数据仓库从业经历,先后就职于京东、阿里、快手,在数据仓库建设、数据仓库治理方面积累了丰富经验,热衷于探索AI在数据仓库中的应用。
阿里云智能技术服务平台部智能技术组算法专家,负责阿里云服务领域Agent平台、多智能体协同等AI大模型技术在客户服务领域的落地。在阿里云服务领域深耕多年,曾负责服务领域大模型的训练调优、对话机器人链路体系的构建,逐步建设起了阿里云服务领域的算法技术体系和各类基础设施,主导构建了阿里云服务领域大模型、服务领域Agent/Multi-Agent技术、知识库问答、知识图谱、推荐系统等。
曾获得阿里云智能集团凌云奖、阿里云天池大数据算法竞赛冠军;曾以第一发明人发表发明专利6项;多次在阿里云开发者公众号发表AI技术文章,累计阅读量破10w+。
于中国科学院计算技术研究所获得博士学位。他的研究方向涵盖大语言模型、多模态大模型、AI for Data Science。相关研究成果在 NeurIPS、ACL、ICLR 等国际人工智能与自然语言处理会议发表论文30余篇,开源的多语言大模型、多模态大模型、数据科学大模型在 GitHub 社区累计获得7000+星标。他长期担任 CCF-A 类国际会议 ACL ARR 的领域主席和责任编辑。个人主页:zhangshaolei1998@github.io。
腾讯云大数据 TCDataAgent 智能体发布与应用实战
AskTable 创始人,前阿里云 PolarDB 创始人之一。前火山引擎数据库产品负责人。
赵恒,Datus.AI 的创始人,StarRocks TSC member。从阿里的数据库开发工程师到多个开源项目的连续创业者。
华中科技大学计算机本硕,毕业在阿里巴巴从事分布式数据库开发,后在数据领域持续创业,曾获得德迅等VC的投资,最终公司被收购。近5年作为创始团队成员负责了开源数据库StarRocks从0到1的产品设计,并专注于北美数据分析市场的开拓和研究。
北航卓越青年学者,主要研究领域涵盖自然语言理解与生成、大模型预训练与微调、代码智能、代码安全等。在ICLR、NeurIPS、ICML、ACL、EMNLP、NAACL、AAAI、IJCAI等发表论文和报告论文百余篇,其中第一作者/通讯作者20余篇,谷歌学术引用14000+次,并担任NeurIPS、ARR (ACL、EMNLP、NAACL)、AAAI-AIA等国际会议的领域主席(Area Chair,AC)和高级程序委员会委员(Senior Program Committee,SPC),以及期刊Electronics特刊客座编辑。
博士期间作为北京航空航天大学与微软亚洲研究院联合培养博士生代表微软参与世界超大规模多语言机器翻译(WMT2021)三项赛道比赛第一,毕业后在阿里巴巴任职期间(入选阿里星计划),作为通义千问(Qwen)及通义千问代码大模型的QwenCoder系列的核心贡献者,参与千问模型代码能力建设及专项千问代码大模型系列研发(已成为学术界常用基线模型,github数千星)。此外,作为国内知名大模型开源组织M-A-P的主要贡献者,开源若干大模型基座模型,包括全开源代码大模型OpenCoder等。
OPPO AI中心技术专家,从事智能体大模型与AI智能体的探索与应用工作。本科毕业于中国科学技术大学,博士就读于中科院大学。研究兴趣包括推荐系统、大模型与AI智能体等,相关研究成果在ACL、ICLR、AAMAS、WWW等国际会议发表论文10余篇,曾获得KDDCUP 2021第四名,ICLR2025 Spotlight等。开源的轻量化大模型 Hammer 系列已集成到谷歌 AI EDGE SDK,在 Huggingface 社区累计下载量达到10W+。
中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注AI技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。
之前曾参与百度小度音箱项目的开发上线工作,加入OPPO后负责过OPPO视频字幕业务上线及优化实施,目前负责OPPO AI搜索业务落地上线及优化工作。
现任金山办公高级算法经理,负责智能体技术在 WPS 的落地。曾就职网易新闻与美团外卖,从事搜索、NLP、广告机制与推荐算法研发。现聚焦多智能体协作、推理奖励塑形与商业机制设计研究。
刘洋 博士,现任字节跳动技术专家,专注人工智能安全与隐私方向,主导多项大模型/智能体安全、联邦学习等项目的研发与落地,拥有NeurIPS、IJCAI、 IEEE/ACM ToN等20余项学术论文,以及40余项人工智能安全、大规模隐私计算基础设施相关的发明专利。毕业于清华大学、澳大利亚国立大学。
超过7年协助跨国及本土大企业数字化转型,6年支持创业及中小公司客户实现高速增长。对网络,容器,微服务,机器学习方面有深层见解和研究。目前带领技术团队专注在利用生成式AI帮助创业及中小企业公司完成更多云原生创新项目的落地。
蚂蚁数科AI业务质量与质量效能负责人,负责蚂蚁数科AI业务整体质量及质量效能平台建设工作,主导构建智能体评测平台&蚂蚁数科质量平台,覆盖从算法验证到业务交付的全链路质量管控。10余年软件开发及测试经验,擅长测试工具开发、质量效能平台建设等方向有丰富的落地经验,曾任职网易、淘宝、腾讯音乐等公司,个人累计申请多篇专利、软著。
徐亮亮是阿里巴巴 Qoder 团队技术专家,目前专注于 Qoder CLI 产品研发工作,致力于提升开发者体验与生产力,探索大模型与工程实践的创新结合,为 AI 时代打造高效基础设施。
曾深度参与阿里巴巴 Kubernetes 容器、微服务产品研发多年,具有丰富的高可用架构设计、资源调度优化以及服务治理经验,近年来持续推动从云原生到 AI 原生应用架构的演进。
在阿里主要负责客服Agent系统及其领域模型训练相关算法。前腾讯AILab算法,中国科学院数学与系统科学研究院博士。
2022 年加入去哪儿旅行,负责自动化测试、录制回放等工程提效工具建设,拥有丰富的复杂系统工程经验。自 2023 年起专注 AI 大模型应用,推动 AI 在测试与需求领域的规模化落地。曾获得去哪儿 AIGC Hackathon 冠军。现作为 AI 创新方向的负责人,主导基于视觉大模型的 GUI Agent 技术研发。
现任 Google Cloud 解决方案架构师,曾担任 EMC、微软等公司工程师、架构师等职位,并获得相关云计算、虚拟化、小机、存储及备份专家认证。
毕业于清华大学,资深AI技术专家。深耕计算机视觉、AI芯片及自动驾驶多年,2023年加入阶跃星程,负责大模型的技术研发工作,主导Step-Audio等项目,目前为Agent研发负责人,具备从底层硬件优化到上层Agent架构的全栈开发经验。累计获得50+项专利,在国际顶会发表多篇论文,擅长解决前沿领域的复杂算法及工程挑战。
李志宇 博士,记忆张量(上海)科技有限公司联合创始人兼CTO、上海算法创新研究院大模型中心技术负责人、研究员。长期从事预训练和大模型应用方向的研发技术攻关,主要研究方向包括大模型记忆增强、高效评估与应用算法。曾在阿里巴巴、小红书等头部科技企业带队承担多个核心算法方向,技术成果服务于商品评价、双十一大促、营销广告等超大规模业务场景,累计带来数十亿营收,影响用户近亿人次,并获得双十一技术突破奖。近年来,先后和团队提出了首个记忆分层的创新架构大模型,以及业内业内首个大模型记忆操作系统(MemOS),MemOS开源三个月累计获得Star数超3300+,开发者数超3000+,为大模型的记忆增强落地提供了可行的探索路径。相关大模型技术成果已在中国银行、招商证券、中国电信、新华社等多家国央企落地应用。当前已在 Patterns(Cell Press)、NeurIPS、ICLR、ACL和TKDE等国际会议期刊发表论文50余篇、引用超千次、授权专利 10 余项。现任中国中文信息学会信息检索专委会委员、大模型与生成专委会委员,相关研究工作入选《麻省理工科技评论》封面报道、《机器之心》、《量子位》和《PaperWeekly》的头条报道,并多次登顶Huggingface热点论文Top1。
小红书中台算法组大模型应用算法专家,主要研究方向为 Agentic AI、Deep Research、LLM Personality 等,先后在 NeurIPS、ICLR、ACL、EMNLP 等发表论文 30 余篇。代表工作包括 Multi-Agent Debate、CipherChat、PsychoBench、DeepAgent 等。前腾讯 AI Lab 高级研究员,香港中文大学计算机科学与工程系博士。
OceanBase obdiag SIG Maintainer,OceanBase 社区TOC 成员。从事OceanBase 数据库的生态建设工作,包括技术布道、AI 生态探索、开发者赋能、工具链优化等。
胡越阳蚂蚁集团产品运营专家
骆昱宇,现任香港科技大学(广州)助理教授、香港科技大学联署助理教授、博士生导师,数据智能与分析实验室负责人。研究兴趣为DATA+AI数智融合方向,包括数据为中心的人工智能(Data-centric AI, DCAI)、大模型智能体(Foundation Agents)、数据智能体(Data Agents)、智能数据库系统(AI for Databases)。 在研项目包括国家科技重大专项课题、国家自然科学基金青年项目等,在数据管理与数据挖掘(SIGMOD/VLDB/ICDE/SIGKDD/TODS)、机器学习(ICML/NeurIPS/ICLR)等领域发表 CCF-A 类论文 40余篇,也担任多个国际顶会的Associate PC Chair/Area Chair和IEEE Data Engineering Bulletin期刊副主编。他获得多个最佳论文/提名奖(如SIGMOD 2023, CIKM 2022, DASFAA 2019),领导或参与开源了多个DATA+AI系统(如DeepEye数据智能体开源;OpenManus智能体项目,Github 5万+Stars)。他曾获世界人工智能大会云帆奖、福布斯中国“30位30岁以下精英”榜、清华特等奖学金、华为火花奖、清华大学优博/优博论文奖/中国计算机学会优秀博士学位论文提名奖等。
腾讯云存储首席技术专家,十多年分布式云存储技术和产品化经验。作为技术领头人,从事过网络、安全、存储等多个领域的技术工作。目前作为腾讯首席云存储技术专家,负责腾讯云存储的解决方案规划、设计和商业化工作。
大模型路径、实践与趋势
企业专属Agent开发实践
2025 年,智能体(Agent)在能力与应用层面实现了跨越式进步。面向消费者市场,以通义千问、豆包、Manus 等为代表的通用 Agent 正在显著改变用户的交互方式与使用习惯。相比之下,企业级的专属 Agent 落地推进相对谨慎:企业在引入 Agent 时,往往首先关注数据隔离与隐私保护、安全与合规要求以及自主可控的治理体系,同时也需要在效果、稳定性与成本之间取得可衡量的平衡。
对多数企业而言,真正需要的往往是契合自身业务、数据与流程的“专属 Agent”,而非开箱即用的“通用 Agent”。这类专属 Agent 通常意味着更严格的工程约束与交付标准。基于此,本次演讲将围绕企业专属 Agent 的落地挑战展开探索,并分享阿里云 PAI 在服务企业客户中的方法与经验。
智能体原生的学习框架Agent Lightning从设计到落地实践
智能体正在从“静态决策器”走向“可持续进化的学习系统”。然而,当前的智能体框架、模型服务系统与学习算法高度割裂,使得在线学习、跨任务适应、记忆演化和行为优化变得异常困难。Agent Lightning旨在解决这一核心瓶颈。我们提出了智能体原生(agent-native)的学习框架,包括统一经验数据层,以标准化格式捕获和组织智能体的交互、轨迹、反馈与工具调用,为各种学习算法直接提供高质量的经验数据;Agent–Optimizer解耦架构,将智能体执行从学习机制中彻底分离,使提示优化、记忆更新、检索调优乃至模型微调都可模块化接入;在线学习算法探索,面向长时序推理、稀疏或延迟反馈、多步骤决策等关键难题,设计更适合真实场景的学习策略;跨场景性能优化,使服务性能、能力演化和实际业务价值形成正反馈闭环。
本次分享将系统介绍Agent Lightning的设计思路、技术架构、核心算法、工程实践与最新进展,展示如何让智能体真正从经验中变得更聪明。
重塑云原生数据基座:腾讯云大数据 DIaaS 全栈数智化能力升级与实践
在 GenAI 浪潮下,传统大数据架构正面临计算异构化、数据多模态化及运维复杂化的严峻挑战。腾讯云大数据推出 DIaaS全栈数智化平台,通过底层架构的全面重构,实现从“数据支撑”到“数智驱动”的跨越。
本次演讲将深度解析腾讯云大数据在调度、管理、计算及运维四个维度的核心技术升级,揭示如何将 YARN+CPU 体系平滑演进至 RAY+GPU 的智算架构。同时,将通过一站式全链路演示,展示从多模态数据预处理、模型训练到过程管理的最佳实践,为企业构建 AI-Ready 的数据基座提供清晰路径。
演讲提纲:
1、调度层重构:从传统数仓到异构智算的跃迁
(1)调度体系升级:从单一的 YARN+CPU 模式,升级为支持 RAY+CPU+GPU 的混合调度架构
(2)资源效能优化:面向大模型训练与推理场景的资源隔离与融合调度策略
2、数据管理升维:TCLake 多模态湖仓一体
(1)管理范式变革:从结构化数据表管理,升级为非结构化、向量化等多模态数据统一纳管
(2)TCLake 核心能力:在保持开源兼容性的基础上,实现多模数据的极致读写与治理
3、计算引擎革新:Xpark + Meson 的极速体验
(1)性能加速:传统计算引擎向 Xpark + Meson 的全栈升级
(2)技术突破:通过软硬一体化优化,实现数据处理与模型计算的倍数级性能提升
4、系统交互跟系统自治变革
(1)DataOps 进化:告别全手工运维,通过 Agent 技术实现智能诊断与自动调优
(2)交互式运维:基于自然语言的系统状态查询与故障排查
5、实战演示:一站式构建数据多模预处理、模型训练、过程管理最佳实践 全生命周期演示
听众收益点:
洞察架构演进趋势: 了解云原生数据基座如何适配 AI 时代需求,掌握从 CPU 同构计算向 CPU+GPU 异构智算转型的技术关键点。
掌握核心加速技术: 深入理解 TCLake 多模态管理与 Xpark+Meson 引擎带来的性能红利,为企业降本增效提供技术选型依据。
体验智能化运维: 直观感受 AI Agent 技术在数据平台运维中的实际应用,学习如何利用智能交互降低运维门槛与人力成本。
复利组合智能:智能体时代的无限可能
人工智能正成为驱动未来科技发展与文明演进的核心引擎,AI的影响远超常规认知,正深刻渗透至芯片、脑机接口及制造业无人化等硬核领域,引发供给端的效率革命。
本次演讲将解析AI技术从“理解”迈向“推理”,并最终进化为“智能体”的关键趋势。同时,也会勾勒AI投资的时间主线,并对比海内外商业化生态:海外市场在环境友好度和模型能力上领先,而国内市场则面临同质化竞争。
AI Agent 产业图谱发布
DeepAnalyze:大模型到数据科学家的 Agentic 进化之路
随着数据量爆炸式增长,数据科学家将大量时间耗费在数据清洗、建模与可视化等重复性工作上。我们团队探索“AI for Data Science”的新方向,提出并开源了全球首个面向数据科学的Agentic LLM——DeepAnalyze。不同于传统的workflow-based方案,DeepAnalyze通过真实场景下的agentic training,使模型具备“自主思考与行动”的能力,可像人类分析师一样独立完成数据准备、分析、建模与洞察。项目开源后迅速获得社区关注,GitHub Star超1500,显著提升数据分析效率与智能化水平。我们相信,DeepAnalyze标志着数据科学正从“自动化工具”迈向“智能协作伙伴”的关键进化。
本次报告将全面解析 DeepAnalyze 的核心技术路线,展示其如何让 AI 真正成为数据科学家的智能助手,并为AI驱动的数据分析未来带来全新启发。
演讲提纲:
一、业务背景与研究动机
1. 数据科学的瓶颈:分析师时间大量消耗在数据清洗、特征工程与可视化等低效环节。
2. 现有自动化方案的局限:Workflow-based Agent 需精细prompt工程、缺乏泛化能力与适应性。
3. 研究愿景:构建能够自主理解、决策与执行数据分析任务的 Agentic LLM,实现从“自动化”到“智能化”的跃迁。
二、方案选型与系统设计
1. 理念提出:以“Agentic LLM”替代传统workflow,让模型具备自主规划与任务执行能力。
2. 技术架构:Agentic LLM
3. 训练策略:在真实环境中进行强化学习式训练。
4. 数据合成:覆盖结构化与非结构化数据分析任务。
三、落地挑战
1. 复杂任务拆解与上下文依赖:如何让模型在长链推理中保持一致性与可解释性。
2. 数据安全与隐私保护:在开放环境下处理真实业务数据的安全策略。
3. 性能与资源权衡:平衡自主决策能力与计算成本。
四、核心解决思路
1. 任务自演化机制:通过自我反思与重规划(replanning),实现多阶段数据任务的自主推进。
2. 可微调的领域适配框架:允许在金融、医疗等垂直领域进行轻量化再训练。
3. 工具协同体系:构建统一的“数据科学工具API层”,提升Agent与外部分析环境的协作效率。
五、应用成效与社区反馈
1. 开源成果:模型、代码、Demo 全面开放,支持本地部署。
2. 社区反响:GitHub Star 超1500,形成多领域开发者生态。
3. 效果验证:在多类真实数据分析任务中,DeepAnalyze 显著优于传统自动化Pipeline方案。
六、未来规划
1. Agentic LLM范式研究:推动AI从任务执行者向智能研究者演进。
2. 跨领域协同分析:拓展至多模态数据(文本、表格、时序、图像)的统一分析。
3. 开放协作生态:与高校、企业共建Agentic数据科学平台。
七、总结与启发
1. 关键观点:DeepAnalyze 展示了AI驱动数据科学的“自主智能”方向。
2. 技术启示:Agentic训练是LLM走向专业领域能力化的关键路径。
3. 愿景展望:让AI真正成为数据科学家的合作伙伴,而非仅仅是工具。
听众收益:
1. 认知升级:理解“Agentic LLM”的范式转变
听众将深入理解从传统“Workflow-based Agent”到“Agentic LLM”的演进逻辑,认识AI如何从被动执行工具进化为具备自主规划与反思能力的智能体,为AI在数据科学中的角色转型提供全新思路。
2. 方法启发:掌握AI驱动数据分析的新路径
通过DeepAnalyze的技术路线与训练框架,听众能系统性了解如何构建具备数据理解、建模、分析和可视化全流程能力的智能系统,为企业或研究机构探索AI自动化分析方案提供可复用的技术参考。
3. 实践借鉴:获得可落地的系统实现经验
听众可借鉴DeepAnalyze在落地过程中的架构设计、Agentic training策略及任务自演化机制,提升对AI在真实业务场景中“从原型到产品”的实现路径的理解,助力自身项目在智能化方向上突破。
腾讯云大数据 TCDataAgent 智能体解读与应用实战
随着大模型能力的爆发,Agent(智能体)已成为连接数据与业务的新一代接口。腾讯云大数据正式发布 TCDataAgent,首次全面公开 TCDataAgent 的产品架构与核心功能,并通过 Demo 实战演示,展示其在数据分析、运维监控及云产品协同中的强大能力。我们将深入剖析 TCInsight 与 AI 助手如何基于 Agent 实现自我进化,并开放 Playground 让开发者一窥智能体开发的无限可能。
演讲提纲:
1、TCDataAgent 产品核心解读
2、产品功能深度演示(Live Demo)
3、场景化应用实战:Agent 在云产品中的落地
TCInsight 智能管家、AI 助手协同、Playground
听众收益点:
抢先了解新品动态: 第一时间获取 TCDataAgent 的核心功能与技术优势,理解腾讯云大数据在 Agent 领域的最新布局。
见证数据交互变革: 通过丰富的 Live Demo,直观感受“对话即分析、对话即运维”的全新工作模式,为业务提效寻找新突破口。
获取落地实战指南: 结合 TCInsight 等实际云产品的应用案例,获得智能体在企业级复杂场景中落地的方法论与参考模板。
AI Agent在快手生活服务数据中心的探索及应用
各公司数据仓库建设或多或少都会遇到“烟囱式建设”、“数据质量”等一系列问题,所以数仓架构师会制定各种规范,包括“分层规范”、“命名规范”、“代码规范”等,但是因为人的因素,这些规范又执行不到位,不能从根本上解决问题,Agent的出现为这些问题提供了新的解决思路。快手生活服务中心探索了“智能评审”、“智能DQC”等AI Agent,提升了数仓建设的质量。
演讲提纲:
1、数仓模型设计、开发过程中存在什么质量痛点?
2、AI Agent如何提升模型设计、开发的质量?
3、数仓相关AI Agent的设计思路与实现细节
听众收益:
1、如何利用Agent解决数据仓库中烟囱式建设问题
2、Agent如何和数仓生产流程相结合
从对话到洞察:Agentic NL2SQL驱动的智能数据分析引擎
本次分享主要介绍阿里云PAI平台的智能数据分析引擎构建及其在阿里云dataworks产品中的落地。通过NL2SQL模型后训练(指令微调+RL)、智能体架构设计,实现自然语言到SQL生成、自动图表与智能报告的全流程闭环。结合ChatBI场景典型案例,将复杂分析简化为对话交互,显著提升业务决策效率与用户体验。
打造沉浸式的 Vibe Analyzing 体验——AI 驱动的数据分析新交互
在传统的数据分析流程中,分析师需要在复杂的报表、SQL 与图表工具间切换,体验割裂、效率低下且门槛高。AskTable(察言观数)基于 Agent 技术,重构了数据分析交互:通过自然语言提问、AI 自动生成 SQL、表格与图表,并以沉浸式的「AI 数据画布」界面,带来连续、直观的分析体验。
演讲提纲:
- 传统分析体验的痛点与局限
- AskTable 的 Agent/Data 技术基建
- 沉浸式 AI 数据画布的设计理念
- Vibe Analyzing 的落地案例
通义多模态、多端 GUI 智能体 Mobile-Agent 实践
随着多模态大模型和AI Agent技术的快速发展,围绕Mobile、PC等端侧构建多模态GUI智能体,以进行自动化操作,成为了现在业界最热的研究应用方向之一,有望变革新的人机交互方式。
我们围绕多智能体架构、复杂任务拆解、自主进化推理、GUI基础模型等技术构建整个通义多模态、多端智能体Mobile-Agent技术体系,包括多模态单智能体Mobile-Agent、多模态多智能体Mobile-Agent-V2、自主进化多模态智能体Mobile-Agent-E、基础GUI智能体Mobile-Agent-v3等,并探索相关技术在手机、车机等多个场景的应用。
Mobile-Agent工作也发表在NeuIPS 2024,并获得CCL2024、2025 Best Demo,相关代码均已开源到Github (https://github.com/X-PLUG/MobileAgent)
演讲提纲:
1. 大模型智能体背景
2. 多模态多端智能体Mobile-Agent
3. Foundation Agent for GUI
4. 开源应用
从代码大模型到通用代码智能体
代码基础模型——那些基于海量代码库预训练的大语言模型——已经在代码生成、理解和补全方面展现出卓越能力,但它们的真正潜力在于与代码智能体和工具的深度融合。我们正在经历一场范式转变:从独立的代码模型,发展到能够与编译器、调试器、API及外部资源动态交互的工具增强型智能体系统。
这些智能体不仅能够进行规划和推理,还能自主执行任务、迭代优化、自我调试。像Cursor这样的AI驱动编辑器和GitHub Copilot这样的AI结对编程工具,就是最典型的代表——它们将基础模型的强大能力与上下文感知、实时反馈相结合,实现了IDE内的自动化操作、语义化代码导航和意图驱动的代码合成。当然,这个领域也面临着可靠性保障、工具依赖处理、计算开销优化等挑战,我们需要通过微调、提示工程、符号-神经混合架构等方案来解决。
更令人兴奋的是,以光标为中心的智能体框架等新兴范式,让模型能够动态交互代码上下文、用户输入和IDE状态,真正实现人机无缝协作。展望未来,从自动化软件工程到自适应DevOps管道,从智能体专业化到人机交互伦理,这个领域还有巨大的探索空间。
总而言之,代码智能体与工具的协同正在重塑软件开发模式,大幅降低复杂编程任务的门槛,加速我们从自然语言描述到健壮可执行系统的转变——这是一场真正的变革。
演讲提纲:
一、背景介绍
代码基础模型正在改变软件开发方式
基础模型在代码生成、理解、补全方面的卓越表现
二、核心观点:真正潜力在于融合
代码智能体:具备规划、推理、执行能力的自主系统
代码工具:通过智能自动化增强开发工作流
深度融合带来的协同效应
三、范式转变
从:独立的代码模型
到:工具增强型智能体系统
关键能力:与编译器、调试器、API、外部资源动态交互
智能体特性:迭代优化、自我调试
四、典型应用案例
Cursor:AI驱动编辑器
GitHub Copilot:AI结对编程工具
实现功能:
IDE内自动化操作
语义化代码导航
意图驱动的代码合成
五、面临的挑战
可靠性保障
工具依赖处理
计算开销优化
六、解决方案
微调技术
提示工程
符号-神经混合架构
七、新兴范式:以光标为中心的智能体框架
动态交互能力:代码上下文、用户输入、IDE状态
目标:实现人机无缝协作
八、未来展望
自动化软件工程
自适应DevOps管道
智能体专业化
人机交互伦理
工具在缓解模型幻觉中的作用
九、总结:变革性影响
重塑软件开发模式
降低复杂编程任务门槛
加速从自然语言到可执行系统的转变
听众收益:
一、知识层面技术认知升级
- 全面了解AI辅助编程的最新技术趋势和发展方向
- 理解代码基础模型、智能体、工具增强等核心概念
- 掌握从传统开发到AI辅助开发的技术演进路径
- 建立对行业前沿技术的系统性认知框架
- 技术对比视角
- 清晰认识传统开发模式与AI增强开发的本质差异
- 了解不同AI编程工具(Copilot、Cursor等)的特点和适用场景
- 理解各种技术方案的优劣势和选择标准
二、实践层面落地实施指南
- 获得可操作的技术落地路线图(3-6-12个月计划)
- 了解如何将AI工具集成到现有开发流程
- 掌握IDE配置、工作流设置的具体方法
- 学习提示工程和上下文管理的实用技巧
三、效率提升开发效率
- 代码编写速度提升60-80%的实现路径
- Bug修复效率提升3倍的工作方式
- 单元测试、文档编写等重复性工作的自动化方案
- 从需求到代码的转化时间大幅缩短学习效率
- 快速上手新技术栈和框架的方法
- 减少50%新人培训时间的实践经验
- API文档查找和代码理解的智能化途径
四、职业发展技能竞争力
- 掌握行业最前沿的开发工具和方法
- 建立AI时代程序员的核心竞争力
- 了解未来5-10年软件开发的趋势方向
- 获得技术转型和职业规划的参考依据
Agent的未来:原生智能与共同演化
本次演讲将深入探讨Agent技术的根本发展模式,批判性地分析当前第三方Agent的局限性,阐述Kimi为何选择通过强化预训练来打造“原生智能”Agent,并论证只有通过开源协作与真实世界交互,才能实现与人类共同演化的高级Agent。
演讲提纲:
1. 当前Agent模式:赛车手与赛车的困境
2. 第一方模型的原生Agent之路:从“教口诀”到“悟规律”
3. Coding:通往AGI的Agent核心试验场
4. 开放协作:实现Agent与人类的共同演化
Google Cloud AI 最新动态解读
OxyGent:构建高效能多智能体系统的协作框架
构建专业级智能体:从开发工具到产业实践的技术闭环
在专业智能体的开发过程中,开发效率与落地效果的平衡始终是核心挑战。九章云极DataCanvas通过自研的智能体开发工具链,实现了从智能体构建、优化到部署的全链路技术突破。
本次演讲将深入分享我们如何通过"智能体创建智能体"的技术路径,结合强化学习与工具化平台,显著提升企业级智能体的开发效率与事实准确性。同时,将结合金融、科研等典型场景,展示智能体开发工具在实际业务中的量化效果,为开发者提供可复用的方法论与实践经验。
演讲提纲:
1. 智能体开发的技术瓶颈与突破路径
- 专业智能体开发的三大挑战:准确性保障、开发效率、业务适配
- 九章云极的解决思路:工具化平台+强化学习的双轮驱动
2. 智能体开发工具链的核心架构
- Agent工厂:自然语言驱动的智能体构建
- 优化引擎:基于强化学习的事实准确性提升(54.2%提升实践)
- 知识库集成:多模态上下文赋能机制
3. 企业级智能体的落地实践
- 金融领域:从商业分析到战略决策的分钟级部署
- 科研场景:Aladdin平台如何提升算力利用率300%-400%
- 案例剖析:智能体开发工具在复杂业务中的量化效果
4. 未来展望:智能体开发工具的演进方向
- 跨平台协作与生态构建
- 低代码与专业开发的融合趋势
听众收益点:
1. 将了解如何通过“工具化平台+强化学习”的技术组合,系统性地解决专业智能体开发中面临的准确性、效率与业务适配难题,学习从构建、优化到部署的全链路实践思路。
2. 了解来自金融、科研等前沿领域的量化实战经验,为听众在自己的领域内规划与落地智能体应用提供可衡量的参考基准和决策依据。
3. 了解智能体开发工具在低代码、跨平台协作等方面的未来发展方向,有助于提前布局技术栈,把握与智算生态协同发展的新机遇。
AI编程中的轻量级智能实践
在AI编程工具日益“重型化”的今天,大家是否陷入了“算力军备竞赛”的误区?当焦点都集中在IDE插件的功能叠加时,Qoder深入命令行这一开发者最原始、最核心的阵地,进行了一场关于“效率”的深度思考。
本次演讲,我将分享Qoder CLI背后的技术哲学与实践,例如我们是如何设计一个内存消耗降低70% 的轻量级Agent框架,如何实现代码审查效率提升50%而质量翻倍的算法优化,以及我们为何坚信 “IDE + CLI”的双引擎模式是未来开发界面的主流。演讲的核心是,介绍如何通过架构设计、算法创新和生态集成,在AI时代为开发者“减负增效”的技术过程。
演讲提纲:
一、技术战略
AI编程工具在资源消耗、上下文局限与工作流断裂上的普遍问题
Qoder为何选择CLI作为突破口——并非放弃IDE,而是构建“双引擎”
二:Qoder CLI的核心技术拆解
1. 轻量级Agent框架的设计之道
2. Quest模式:从“人驱动”到“目标驱动”的编程
3. 智能代码审查的算法内核
三:与开发生态共融的技术路径
MCP 协议允许开发者自定义和扩展Qoder CLI能力
“Vibe Coding”的工程化实现
四:轻量级智能的未来
通过技术架构和创新算法实现降维打击。
轻量级智能在云原生、边缘计算场景下的巨大潜力
听众收益点:
1. 了解一个高性能、低消耗的AI编程Agent框架应如何设计,获得在资源受限环境下进行AI应用开发的思路。
2. 获取智能代码审查、任务自动化分解等核心功能的前沿算法思想与实践经验,可直接借鉴到自身的开发或研究工作中。
3. 深入理解“IDE+CLI”双模式、轻量级智能的未来发展趋势,为个人技术规划或团队技术选型提供有价值的参考。
构建可理解界面、可执行任务的智能体:移动端 GUI Agent 技术拆解
在移动互联网的“孤岛效应”下,应用间缺乏互通的 API 使得复杂跨应用任务难以自动化。传统的基于控件树(View Tree)和规则的 RPA 方案在面对动态布局、非标准控件及复杂业务逻辑时显得捉襟见肘。
本演讲将分享一套基于多模态大模型(VLM)驱动的 GUI Agent 架构。我们将探讨如何利用 AI 赋予 Agent 像人类一样“看懂”屏幕的能力,如何在没有 API 的情况下进行跨 App 的复杂操作,以及在实际工程落地中,如何解决推理延迟、幻觉控制及上下文记忆等核心挑战。
演讲提纲:
1. 背景与痛点:为何我们需要 GUI Agent?
- 移动端的“黑盒”现状: API 缺失与 App 间的数据孤岛。
- 传统自动化的局限: 这里的“脆性”问题(UI 改版即挂、DOM 树获取失败)。
2. 核心架构设计:模拟人类的操作流
- 感知层 (Perception):
双流感知机制: 结合 结构化数据 与 视觉快照。
语义对齐: 如何将屏幕截图中的像素坐标映射为可操作的语义元素。
- 规划层(Planner):
将复杂任务拆成多个任务的集合。
- 思考层 (Reasoning):
任务拆解: 结合上下文和当前情况,对当前状态和下一步操作做出准确判断。
反思机制: 当操作失败(如弹窗广告、加载失败)时的自我修正策略。
- 执行层 (Action):
动作空间定义: 点击、滑动、输入、返回、跨 App 切换。
3. 关键技术难点攻克
- 多步骤任务中的稳定性
- 如何平衡成功率,成本与速度
4. 实际效果与未来展望
听众收益:
1. 架构参考:获得一套完整的、可落地的移动端 GUI Agent 技术架构图。
2. 方案避坑:了解在处理复杂任务时的具体工程技巧。
3. 前沿视野:理解多模态大模型在 UI 自动化领域的最新应用范式。
2025年【星空奖】发布
Agent时代下的代码评测范式革新
Agent时代,大模型由简易问答机器人向实用化智能助手演进,编程(Coding)领域的技术潜力尤为突出。然而,传统评测多采用“教学考试”模式,将人类程序员的考题直接迁移至大模型,存在题目脱离真实场景、依赖专家命题等局限。针对这些挑战,美团EVA团队与AGI-Eval展开深度合作,共同探索面向未来的评测新范式。
我们的研究重点在于构建更贴近真实开发需求的评估体系,通过多维度、场景化的评测方法,全面考察智能体在实际开发中的表现。我们希望相关探索能推动代码评测从“应试能力检测”转向“工作能力验证”,为未来智能体的研发和评测提供科学指导。
评测驱动可信:蚂蚁数科金融级智能体评测体系落地实践
当前智能体评测面临多重挑战,包括任务复杂性导致的行为不确定性,以及评估方法的局限性。尤其在金融场景下,对性能稳定性、决策可解释性、安全合规性及伦理风险控制的要求更为严苛。因此,亟需构建科学化的评估框架,通过量化性能、效果和安全等维度,实现系统化评测,以提升智能体在企业级应用中的可靠性和落地效果。
本次分享重点探讨以智能体为核心的评测体系构建,阐述在AI Agent驱动的业务应用中通过性能、效果、安全等核心环节实现智能体的深度评测与优化,我们将结合银行、保险等金融场景实践,实现Agent的深度评测与持续优化,并输出可复用的质量保障范式,助力智能体在严谨行业的安全、高效、规模化落地。
演讲提纲:
1、智能体质量保障的挑战和重要性
2、智能体质量保障的整体方法策略
3、智能体效果评测的方法和标准
4、一站式智能体评测平台建设
5、总结+未来展望
听众收益:
1. 掌握企业级AI Agent评测的核心方法论
理解如何科学评估Agent能力,告别“黑盒式验收”,为技术选型、供应商评估和项目决策提供可量化、可交付的依据——尤其适用于金融、政务等高敏场景。
2. 获得可复用的评测工具链与工程实践
深入学习评测数据构造、评测体系建立、评测智能体、效果归因分析等关键技能,了解高质量评测平台的设计逻辑,助你快速搭建适配自身业务的智能体评测基础设施。
3. 带走一套“理论+实战”融合的评测框架
基于蚂蚁数科在银行、保险等真实场景的落地经验,提供从评估标准定义到工具链建设的完整路径,让你不仅能“看懂评测”,更能“建得起、用得上、说得清”。
让智能体更可信的Jeddak AgentArmor 技术挑战与落地实践(视频播放)
LLM Agent广泛应用于商业办公等多领域,但面临严重信任挑战,如输入端易受恶意信息渗透、规划端理解指令不充分、行动端存在过高权限访问风险、输出端易泄漏敏感信息。我们打造“行为零信任”的运行时信任加固能力AgentArmor,让可信智能体具备抵御攻击、行为无害、可靠精准三大特性,缓解智能体Security、Safety、Functionality三类风险。
AgentArmor对安全威胁的识别率达93%,相较于传统方案,在安全与效用两方面展现明显相对优势,并输出在智能体平台、MCP市场、GUI Agent等领域的典型落地案例。
演讲提纲:
一、业务背景阐述
1. 智能体技术发展趋势
2. 智能体面临的信任挑战
3. 三大可信风险具体表现
二、方案选型:AgentArmor可信智能体方案
1. 核心目标设定
2. 技术路线选择
3. 产品集成优势
三、落地挑战分析
1. 技术层面
2. 业务层面
四、解决思路与实践
1. 核心功能落地
2. 典型应用案例解决
3. 性能优化举措
五、未来规划
听众收益点:
1. 听众可掌握LLM Agent发展与应用,明晰其三大可信风险及危害,建立领域风险认知;
2. 能理解AgentArmor核心功能与技术路线,明确其防护性能优势,掌握可信防护方案;
3. 可获取AgentArmor落地经验,了解纵深防御逻辑,明晰智能体防护趋势。
构建下一代Agentic AI应用的技术实践
大模型不再稀缺,真正稀缺的是能落地、可控的 Agentic AI 应用。本演讲介绍如何在 AWS 上结合 Kiro、AgentCore 与 QuickSuite,构建智能体编排与工具调用底座。针对“幻觉放大”“Agent 失控”“数据隔离”等难题,我们将拆解架构选型与治理机制,并预览 re:Invent 2026 新服务如何提升调试效率,助力团队把 Agent 从 Demo 推向规模化生产系统。
演讲提纲:
- 行业背景与趋势:
- 业务痛点与失败模式:为什么很多 Agent 项目止步 PoC
- 技术方案选型:AWS + Kiro + AgentCore + QuickSuite 的角色分工
- 落地挑战拆解:从 Demo 到生产的关键拐点
- 解决思路与架构实践
- 客户案例:从问题到成效的闭环
- 总结
落地挑战和方案重点:
- 为何Agentic AI相关的项目大都止于PoC阶段,目前Agentic AI的项目都遇到了哪些困难
- AWS如何利用自身服务,帮助开发者度过这些难关
- AWS服务过的客户是怎么做的
阿里云百炼Agent平台与智能体开源框架AgentScope
在大模型快速发展的推动下,智能体能够将内在知识与外部工具运用相结合,从而极大地增强了其处理复杂任务的能力。顺应这一发展趋势,阿里云百炼Agent平台以及开源框架AgentScope,全面支持灵活高效的智能体-环境交互,以构建丰富的智能体应用。具体而言,我们抽象了智能体应用所必需的基础组件,包括记忆、工具等,并提供统一的接口和可扩展模块,使开发人员能够轻松利用最新进展。
在此基础上,我们集成了多个针对特定实际场景定制的内置智能体,开箱即用,轻松扩展领域知识,快速适配多样化业务场景;通过自我进化机制,实现知识积累与技能提升。此外,百炼Agent平台及AgentScope还提供强大的系统支持,包括基于动态能力扩展与可视化开发,支撑智能体开发全流程;以生产级运行时和多语言支持,构建从开发到部署的可靠闭环。这些功能为构建可扩展、自适应且高效的智能体应用提供了切实可行的基础,真正让智能体从原型走向落地。
全栈开源 AgenticOS 的创业实践
LemonAI 是全球首款全栈开源的 AI Agent,Github上排名前列的一款可以本地完整部署,具有 VM Sandbox 的全栈开源的多智能体 Multi-Agent 的 Agentic OS,基于 Agentic-Memeory 实现 AI Agent 的 Self-Evolving 能力,并线上 AgentStore 共享社区 Experience,让 Agent 越用越好。此次演讲将基于 LemonAI 的过去9个月的实际开发经验和 knowhow,跟大家分享 AgenticOS 的实战经验,方便大家在未来能够与自己的业务和行业结合,实现 Agentic 时代的转变。
演讲提纲:
1、AgenticOS 的基本概念
2、AgenticOS 的行业现状
3、AgenticOS 的应用场景
4、AgenticOS 的未来思考
听众收益:
了解 AI Agentic 的核心理念和认知,突破现有对AI行业技术和发展的瓶颈认知,获得下一代AI最前沿的理念,经过实战思考未来趋势。
从工具到伙伴:OPPO AI智能体技术探索与实践
AI智能体早已在手机里展现潜力,相关技术已深入手机操作流程,成为用户日常生活工作的工具,并继续走向真正懂得用户的伙伴。
本次演讲将系统介绍我们在AI智能体方面的技术思考、智能体设计与优化策略,以及在小布助手中的落地实践,并展望其在手机设备上未来的演进方向与应用前景。
演讲提纲:
1. 手机智能体背景介绍
2. API智能体与GUI智能体
3. 个性化智能体应用
4. 应用难点与未来展望
听众收益:
1. 终端设备视角的AI智能体思考
2. OPPO在关键技术上的探索
3. AI智能体在手机上应用实践
“云小二Aivis”的架构实践:基于上下文工程与多智能体的自主服务新形态
“云小二Aivis”是阿里云客户服务领域的AI数字员工,它标志着我们从传统的智能辅助客服,迈向了更端到端Multi-Agent的数字员工能力的全新阶段。云小二Aivis核心是基于LLM的思考推理能力,在Multi-Agent和上下文工程的技术架构下,结合各类MCP Tool、Browser Use、Computer Use等工具调用能力,可以让数字员工能更像人一样去思考和解决问题。
这其实是一个非常有挑战的课题,这背后涉及到算法、工程、数据等多个维度的攻坚,本演讲将会从上下文工程和Multi-Agent技术出发,讲述“云小二Aivis”的实现落地过程,给ToB领域企业级Agent的开发提供许多借鉴思路。
演讲提纲:
1. 阿里云客户服务领域的业务痛点和挑战
2. “云小二Aivis”的多智能体架构设计
3. 基于上下文工程对“云小二Aivis”的调优经验
4. “云小二Aivis”的实际落地效果展示
听众收益:
1. “云小二Aivis”的多智能体架构设计
2. “云小二Aivis”的上下文工程实践经验
3. ToB领域的企业级Agent调优方法论
重塑办公数字员工:AI Agents 在 WPS 协作场景中的创新与实践
在新一代数字办公场景中,我们希望让 AI 不再只是“问答助手”,而是真正参与团队协作的数字员工。基于 WPS 的业务特性,我们构建了 hierarchical reACT + CodeACT + DeepAgents 编排器 的智能体体系,使其可在文档创作、项目协作、数据分析等多场景中完成端到端任务。
落地过程中面临三个核心挑战:多智能体协作效率、上下文成本与 365 工具生态的深度接入。为此,我们在 365 体系内实现工具化打通,引入 MCP 融合与子 Agent 裁剪,并通过 tag-cache 记忆压缩与 KV-cache 加速 将复杂任务时延大幅度降低。
同时,通过 fc & prompt 双模式适配 SaaS 与私有化场景,并构建类适配 365 体系的多轮测评体系,使任务成功率在关键协作场景提升 30%+。本次分享将聚焦上述方案背后的工程实践与机制设计思考。
演讲提纲:
一、办公场景中 Agent 需求的结构性变化和产品落地探索
二、 Hierarchical ReAct + CodeACT + 多 Agent 编排架构实践
三、上下文工程与工具调用稳定性的关键工程经验
四、团队级 Agent 协作的系统化探索与未来规划
听众收益:
1. 系统理解“办公场景中的 Agent 化”如何真正落地
了解 WPS 在团队协作、项目管理、数据分析等业务中的真实痛点与需求,以及如何为这些场景选型 hierarchical reACT、CodeACT、DeepAgents 等体系化方案。
2. 掌握复杂业务中部署多智能体系统的工程方法论
包括工具化打通、上下文压缩与加速、子 Agent 裁剪、工具调度策略等可复用经验,可直接帮助企业推进自身的 Agent 落地项目。
3. 获得可迁移的机制设计与评估体系经验
如 fc & prompt 双模式适配、任务成功率提升策略、多轮测评框架等,可用于提升自身产品的智能体稳定性与业务效果。
软件智能体构建过程中的一些原则经验分享 (远程演讲)
软件智能体正在成为系统中的“一等公民”。当执行者从人变成 Agent,原有为人设计的软件与基础设施开始失效。Agent 的高速迭代、并发试错和自主决策,要求系统具备新的约束与抽象。在本次演讲中,我将结合实际系统经验,并以一些成功的 coding agent 为例,分析 AI-native 软件应遵循的设计原则,以及这些原则对未来系统架构的影响。
基于Flink的实时推理与Agent构建
Flink 作为流式计算的事实标准,在AI时代不断扩展与大模型及 Agent 应用的结合。在 RAG 知识库场景,通过 Flink 在 SQL 流中实时调用 LLM,为知识库提供实时知识更新;在推理场景,通过 Flink+Fluss 构建流式推理管道,结合大模型实时追踪风险与变化;在 Agent 场景,Flink 引领事件驱动型的Agent开源框架,通过系统自动触发 Agent,减少人为干预,推动 Agent 向自动化、智能化发展。
DeepEye:一站式数据智能体系统架构解读
以Text2SQL为代表的智能问数技术利用自然语言交互降低数据访问门槛,但其传统方法在泛化性与适应性上存在局限。大语言模型等技术的突破,正推动该领域向更自主的数据智能体范式演进。
本次演讲将探讨这一演进中的核心进展:智能体架构(如融合规划、决策与反馈的推理框架)显著提升了复杂查询的零样本泛化与可控性;交互能力的深化(如多轮对话、意图分解与澄清)使交互更自然精准;数据理解与操作的扩展(如跨模态融合)则拓宽了应用场景。最后探讨如何构建下一代高效、可靠、普适的数据智能体系统。
听众收益:
- 掌握数据智能体前沿发展趋势。
- 洞悉DeepEye数据智能体开源系统细节。
- 获得数据智能前沿科研和创新机会。
开源 Data Engineering Agent 的成长之路
演讲提纲:
- AI时代数据工程的挑战
- Datus Agent的架构设计
- Datus Agent的实战与落地
- Data Engineering Agent的未来发展
听众收益:
- 理解Data Engineering Agent 的核心理念与价值,认识数据工程从“建表和跑数”向“可交付的SubAgent”转变的趋势。
- 学会如何从表、指标、SQL历史中自动构建数据上下文(Data Context),提升 NL2SQL / 分析问答的准确性与可落地性。
- 理解如果通过feedback loop持续构建可提升的 Data context 和 模型。
上下文工程新范式:构建自主决策 Agent 的智能数据基座
在自主决策Agent的开发中,上下文工程是决定Agent决策质量的关键因素。本次分享将从上下文工程的视角,深入探讨如何通过PowerMem、PowerRAG和seekdb的组合,为自主决策Agent构建一个高效、智能的数据基座。
演讲提纲:
1. 上下文工程:Agent决策的基石
- 为什么上下文工程决定Agent质量
- 当前面临的三大核心挑战:记忆管理、知识检索、数据统一
2. PowerMem:让Agent拥有"记忆"
- 基于艾宾浩斯遗忘曲线的智能记忆系统
- 多智能体记忆隔离与协作机制
3. PowerRAG:让Agent"理解"文档
- 多引擎OCR与文档处理能力
- 混合检索
4. seekdb:统一的数据基座
- AI原生数据库:统一向量、文本、结构化数据
- 混合搜索与数据库内AI工作流
- MySQL兼容与生态集成
5. 组合实践:从数据到决策的完整链路
- 架构设计:分层解耦的上下文工程体系
- 实践路径:文档处理→知识存储→智能检索→Agent决策
听众收益:
- 系统性理解上下文工程:掌握自主决策Agent上下文工程的核心挑战与解决方案
- 获得可落地的技术方案:了解PowerMem、PowerRAG、seekdb的组合使用方式
小米 GUI Agent 的思考和实践
在人工智能与移动终端深度融合的浪潮中,如何让智能体真正“看懂”界面、“自主”操作,已成为人机交互领域的关键挑战。小米 GUI Agent,作为基于视觉语言模型的图形界面智能体,通过端到端的感知与决策能力,实现了对手机、汽车等多场景的跨平台精准交互,无需依赖传统结构化数据,极大拓展了智能助理的应用边界。
在2025年10月的 SuperCLUE 测评中,小米 GUI Agent 以90.01分的优异成绩斩获金牌,在13款国内外竞品中位列第一,标志着手机交互正从语音助手时代迈入 GUI 智能体驱动的新阶段。
本次演讲将系统介绍我们在 GUI Agent 方面的技术思考、核心模型架构、强化学习优化策略,以及在手机与汽车座舱等场景中的规模化落地实践,并展望其未来的演进方向与应用前景。
演讲提纲:
1、GUI Agent 概述:从自动化工具到感知决策智能体
2、核心技术架构:视觉语言模型与强化学习的深度融合
3、系统能力评测与实际场景表现
4、落地实践:从手机到跨设备场景的规模化部署
5、未来展望:GUI Agent 的技术演进与生态构建
听众收益:
- GUI Agent 的基础认知
- GUI Agent 小米的前沿研究
- GUI Agent 小米的落地实践经验
腾讯云 Data Platform 构建 Agent Memory Lake:让智能体拥有无限记忆
腾讯云 Data Platform 构建的 Agent Memory Lake 为智能体构建几乎无限的记忆空间,统一管理结构化、半结构化和非结构化数据,实现短期交互与长期知识积累。通过分层存储与智能检索,智能体可以高效访问历史经验数据并持续学习,广泛应用于自动驾驶、智能客服和机器人等场景,让 AI 不仅能理解,更能真正记住。
演讲提纲:
1. 智能体的记忆挑战
2. Agent Memory Lake 介绍
3. 腾讯云 Data Platform 解决方案介绍
听众收益:
了解 Data Platform 如何提供统一存储、加速和智能管理,为智能体记忆能力提供支撑;
了解 Agent Memory Lake 如何结合分层存储,实现智能体快速访问历史经验数据和持续学习;
启发实践思路:获得在自动驾驶、智能客服、机器人等场景中,构建智能体长期记忆的可行方案与参考。
客服领域Agent模型的内外兼修之道
在阿里云客服业务中,我们面临着大量中频、长尾的复杂工单,传统定制化 Workflow 的方案难以规模化覆盖。为应对这一挑战,我们摒弃了单点定制的思路,转而构建一个可长期规模化的通用型 Agent 系统。我们的核心理念是「内外兼修」:对模型外,通过自研的在线阅读器和上下文管理器,将冗长、嘈杂的工单信息提炼为高质量的输入,解决“垃圾进,垃圾出”的源头问题;对模型内,我们设计了一套高质量训练数据构建的 Pipeline,并结合强化学习,高效地将模型的行为与人类专家的行为对齐。
演讲提纲:
- 业务背景与挑战:为何需要通用自助型Agent
- 模型之「外」:构建高质量的信息环境
- 模型之「内」:SFT与RL的双重修炼
- 总结与Takeaway
听众收益:
- 掌握构建复杂任务 Agent 的系统性方法论,解决长上下文、高噪声场景的工程经验;
- 了解如何基于高噪声的专家轨迹,构建可用于模型训练的高质量数据。
可扩展、可个性化:面向 AI 创新应用的 Agent 核心能力探索
为满足小红书在旅行规划等 AI 创新应用中对可靠性、可扩展性和深度个性化的需求,我们聚焦于 Agent 的多个核心能力的探索和升级:
(1)工具调用的可靠性: 针对工具调用在复杂场景中的鲁棒性不足,我们引入 LoopTool 框架,通过数据-模型闭环实现 Agent 对自身工具能力的自主进化和持续修复,保障行动指令的准确性。
(2)Agent 的自主与通用能力:提出DeepAgent 架构以自主记忆折叠高效管理长程任务上下文,实现对大规模工具集的可扩展学习,确保架构的通用性。同时,提出Agent2World 框架通过自主生成符号世界模型,赋予 Agent 环境认知能力,实现认知的持续升级。
(3)复杂个性化规划能力:针对高约束任务(如旅行规划),提出 TravelPlan-o1,采用竞争共识推理(CCoT)机制,通过多路径的内部自我验证,保证 Agent 能够生成兼具可行性与深度个性化的高质量决策方案。
演讲提纲:
- AI 创新应用对 Agent 的能力需求
- Agent 工具调用的可靠性
- Agent 的自主与通用能力
- Agent 复杂个性化规划能力
- 总结与Takeaway
听众收益:
- 掌握构建高可靠、自主通用 Agent 的系统性方法论,解决工具调用鲁棒性、长程上下文管理和 Agent 认知升级的技术经验。
- 理解和应用高阶规划范式,通过多路径自我验证机制,解决复杂约束场景中 Agent 决策的高可行性与深度个性化问题。
灵光App 全模态通用AI助手—AGI时代的用户体验革新(视频播放)
面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进
个人数字记忆碎片化是终端Agent面临的核心挑战。本次演讲分享OPPO如何构建一个面向手机Agent的记忆系统,以解决“记不起、找不到”的用户痛点。我们将深入探讨这一系统的三大核心支柱:
1. 记忆机制设计:如何为手机Agent设计端云融合的分层记忆机制,实现从瞬时感知到长期记忆的协同运作。
2. 知识增强策略:为何我们选择Agentic-RAG作为主架构,并巧妙融合轻量微调,以在成本、时效性和隐私间取得最佳平衡。
3. 上下文管理与成本优化:如何通过动态上下文压缩与窗口管理策略,在保证95%问题准确性的同时,将端侧响应时延压缩到极致。
我将以已商用OPPO手机AI搜索为例,分享在召准F1=83.9% 的背后,我们在模型选型、工程架构上的权衡、痛点与前沿思考。
演讲提纲:
一、引言:手机作为个人数字记忆体——Agent记忆工程的机遇与挑战
二、核心架构:面向手机Agent的记忆系统设计
三、实战:高精度、低时延记忆检索的工程实现
四、未来演进:更智能、更经济的Agent记忆
听众收益:
1. 获得一套经过大规模用户验证的、端云融合的Agent记忆机制设计蓝图。
2. 深入理解“RAG vs. 微调”在终端场景下的决策权衡与混合实践,而仅是理论对比。
3. 掌握一套可落地的上下文压缩与窗口管理策略,直接用于解决长上下文带来的成本与延迟问题。
4. 学习如何将大模型的智能与确定性工程逻辑结合,构建稳定、可靠的商用AI产品。
GAM:从静态记忆到即时检索的通用智能体记忆架构
MemOS 记忆操作系统架构设计与关键技术挑战
EverMemOS:拒绝“金鱼记忆”,超越 RAG,打造 AI 的可成长“第二大脑”
尽管大语言模型(LLM)的参数量呈指数级增长,但当今的 AI 仍面临一个核心悖论:它们是“博学”的,却也是“无状态”的。现有的 RAG 和超长 Context Window 方案面临着成本高昂、推理延迟和信息迷失等挑战,无法赋予 AI 真正的连续性自我 。
本次演讲将发布 EverMemOS——下一代 AI 长期记忆操作系统。不同于传统的静态存储,EverMemOS 采用仿生分层架构,模拟人脑海马体与前额叶的协作机制,支持动态情景记忆与语义记忆的自我演化 。实测数据显示,EverMemOS 在 LoCoMo、LongMemEval 等权威评测中均达到 SOTA 水平(LoCoMo 准确率 93.01%),在大幅降低 Token 消耗的同时,实现了优于全量上下文输入的检索精度 。
演讲还将分享 EverMemOS 在企业级协作平台 Tanka 的落地实践,并正式公布 2025 年开源计划 。我们致力于通过构建通用的记忆基础设施,推动 AI 从“一次性工具”向具备个性化历史与成长能力的“合作伙伴”进化 。
演讲提纲:
- 范式重构:告别“金鱼记忆” 深度剖析为何现有的 RAG 和超长 Context 只是“短期工作记忆”,揭示 AI 从“空间参数”向“时间结构”进化的必然路径 。
- 硬核架构:仿生记忆 OS 解密 EverMemOS 的仿生分层架构(模拟海马体/前额叶),如何通过动态情景记忆(Episodic)与语义记忆(Semantic)的协同,实现信息的无限存储与精准提取 。
- 极致性能:SOTA 评测数据 凭数据说话!EverMemOS 在 LoCoMo、LongMemEval 等基准测试中准确率高达 93.01%(远超 Zep 与 Mem0),并在保持高性能的同时大幅降低 Token 消耗与推理成本 。
- 落地实战:从 Tanka 到开源 分享在企业级协作平台 Tanka 的落地案例(处理百万级数据),并首度公开 2025 开源路线图与开发者接入计划 。
听众收益:
- 认知升级:跳出 RAG 与长文本的“成本陷阱” 深入理解为何单纯依赖长 Context Window 无法解决 AI 的“自我延续性”问题 。听众将获知 AI 记忆从“空间参数”向“时间结构”演进的最新技术趋势,明确下一代 Agent 必备的“第二大脑”形态 。
- 架构解密:掌握 SOTA 级的仿生记忆系统设计 全面解析 EverMemOS 的仿生分层架构(海马体/前额叶机制),学习如何通过动态情景记忆与语义记忆的协同,构建准确率高达 93.01% (LoCoMo Benchmark) 的记忆系统,同时显著降低推理成本与 Token 消耗 。
- 实战落地:获取“开箱即用”的工程化指南 拒绝纸上谈兵。听众将获得从 Docker 部署到 API 调用的完整接入指南 ,参考百万级数据量的企业落地案例(Tanka),并抢先了解 2025 年即将发布的开源框架与云服务路线图,为构建具备长期记忆的智能应用做好技术储备 。
如何让 Agent 真正记得住:基础模型视角下的 Agent 长期记忆工程
主要从基础模型和应用双重角度下,讨论memory的定义、重要性以及当前的痛点,包括获取完整记忆难,评价难等问题。对比 RAG 与 model-based 两类方案,分析当前各个方案的优劣性。并提出一套实践方案,结合RAG与模型的Hybrid Memory 实践路径,围绕“获取‑组织‑利用”搭建记忆工作流,按场景定义指标,并联合调优模型与 PPL,构建记忆评价与数据飞轮;在内部试点中用户使用黏性有明显的提升。最后针对当前的技术、隐私、体验等瓶颈进行分析,并对未来技术进行展望。
演讲提纲:
一、为什么Memory如此重要和痛点分析
1. Memory定义
2. 模型记忆:从基模角度如何看待memory(长期记忆对于技术突破的重要性)
3. 产品记忆:从应用角度Memory的重要性
4. 当前Memory技术存在哪些痛点
a. Context 获取困难拿不到“完整上下文”
b. Long Context 不知道如何评价
2. Memory 实现的基础方案
a. 介绍 RAG 方案及优劣势
b. 介绍 Model-based 方案及优劣势
3. Memory 业务实践流程(基础模型侧可以多做哪几件事,构建记忆评价与数据飞轮)
a. 定义场景和优化目标以及评测方式指标
b. Hybrid 方案方案及优劣势
c. 搭建工作流
d. 模型和PPL 端到端调优(在预训练/后训练阶段刻意优化让记忆更好用)
4. 当前瓶颈和未来展望
a. 当前瓶颈与落地挑战(包括技术、隐私、体验挑战等)
b. 未来展望(从长期记忆到到多智能体社会)
听众收益:
- 角度层面:介绍在“基础模型视角”下,Agent 记忆能力是如何被拆解为短期上下文、长期用户记忆和语义知识三层,以及模型能力与系统工程的清晰分工;
- 工程层面:有一套可落地的记忆工程方法论。学会用「获取‑组织‑利用」三板斧设计记忆模块,知道记忆与 RAG 的本质区别,如何设计写入、遗忘和调用策略;
- 评估与增长层面:利用数据飞轮优化记忆能力。了解如何设计评价指标,并通过数据循环进行效果优化。
大模型路径、实践与趋势
姜大昕博士是自然语言处理领域的全球知名专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验。姜大昕博士曾担任微软全球副总裁,微软亚洲互联网工程院副院长、首席科学家。2023 年,姜大昕博士创立上海阶跃星辰智能科技有限公司,致力于实现通用人工智能(AGI)。
企业专属Agent开发实践
智能体原生的学习框架Agent Lightning从设计到落地实践
杨玉庆博士现任微软亚洲研究院首席研发经理,负责领导上海系统组,专注于大模型系统与智能体系统的研究工作。他的研究兴趣包括大规模语言模型的高效计算与推理,尤其关注长上下文模型的推理加速;以及智能体的系统设计与优化,包括面向智能体的系统调度优化、多轮强化学习系统与算法等。他的相关研究成果已多次发表在OSDI、SOSP、EuroSys、ATC、CVPR、ICCV、NeurIPS等国际顶级学术会议上。杨玉庆博士于2006年和2011年分别获得复旦大学学士与博士学位。
重塑云原生数据基座:腾讯云大数据 DIaaS 全栈数智化能力升级与实践
复利组合智能:智能体时代的无限可能
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
AI Agent 产业图谱发布
DeepAnalyze:大模型到数据科学家的 Agentic 进化之路
于中国科学院计算技术研究所获得博士学位。他的研究方向涵盖大语言模型、多模态大模型、AI for Data Science。相关研究成果在 NeurIPS、ACL、ICLR 等国际人工智能与自然语言处理会议发表论文30余篇,开源的多语言大模型、多模态大模型、数据科学大模型在 GitHub 社区累计获得7000+星标。他长期担任 CCF-A 类国际会议 ACL ARR 的领域主席和责任编辑。个人主页:zhangshaolei1998@github.io。
腾讯云大数据 TCDataAgent 智能体解读与应用实战
腾讯云大数据 TCDataAgent 智能体发布与应用实战
AI Agent在快手生活服务数据中心的探索及应用
10年+的数据仓库从业经历,先后就职于京东、阿里、快手,在数据仓库建设、数据仓库治理方面积累了丰富经验,热衷于探索AI在数据仓库中的应用。
从对话到洞察:Agentic NL2SQL驱动的智能数据分析引擎
打造沉浸式的 Vibe Analyzing 体验——AI 驱动的数据分析新交互
AskTable 创始人,前阿里云 PolarDB 创始人之一。前火山引擎数据库产品负责人。
通义多模态、多端 GUI 智能体 Mobile-Agent 实践
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
从代码大模型到通用代码智能体
北航卓越青年学者,主要研究领域涵盖自然语言理解与生成、大模型预训练与微调、代码智能、代码安全等。在ICLR、NeurIPS、ICML、ACL、EMNLP、NAACL、AAAI、IJCAI等发表论文和报告论文百余篇,其中第一作者/通讯作者20余篇,谷歌学术引用14000+次,并担任NeurIPS、ARR (ACL、EMNLP、NAACL)、AAAI-AIA等国际会议的领域主席(Area Chair,AC)和高级程序委员会委员(Senior Program Committee,SPC),以及期刊Electronics特刊客座编辑。
博士期间作为北京航空航天大学与微软亚洲研究院联合培养博士生代表微软参与世界超大规模多语言机器翻译(WMT2021)三项赛道比赛第一,毕业后在阿里巴巴任职期间(入选阿里星计划),作为通义千问(Qwen)及通义千问代码大模型的QwenCoder系列的核心贡献者,参与千问模型代码能力建设及专项千问代码大模型系列研发(已成为学术界常用基线模型,github数千星)。此外,作为国内知名大模型开源组织M-A-P的主要贡献者,开源若干大模型基座模型,包括全开源代码大模型OpenCoder等。
Agent的未来:原生智能与共同演化
Google Cloud AI 最新动态解读
现任 Google Cloud 解决方案架构师,曾担任 EMC、微软等公司工程师、架构师等职位,并获得相关云计算、虚拟化、小机、存储及备份专家认证。
OxyGent:构建高效能多智能体系统的协作框架
中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注AI技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。
构建专业级智能体:从开发工具到产业实践的技术闭环
缪旭博士,九章云极DataCanvas公司AI首席科学家,是人工智能领域的杰出布道师。
毕业于华盛顿大学,拥有超过二十年的AI研究与管理经验,长期深耕于AI技术的实现与应用,特别是在AI人机交互方式的探索与落地方面,取得了卓越成就。
学术造诣深厚,在ACM SIG KDD、IJCAI、IJCV、NeurIPS及Neural Computation等国际顶级期刊与会议上,发表多篇具有影响力的学术论文,并拥有授权美国发明专利10余项。不仅展现其在AI领域的深厚底蕴和卓越创新精神,更为AI技术的发展和应用提供了有力支撑。
曾在微软研究院和LinkedIn等国际知名企业担任研究员等重要职务,曾成功创办Astound.ai、Reasoned.ai等多家高科技公司,专注于将可推理可解释的人工智能、大模型、大规模实时机器学习、情感计算等前沿AI技术加速应用于各行各业,推动AI技术的商业化进程。
于2023年入选国家启明计划,目前作为九章云极DataCanvas的AI首席科学家,继续引领公司在AI技术的研发与应用方面不断突破,为推动AI技术的创新与发展贡献力量。
AI编程中的轻量级智能实践
徐亮亮是阿里巴巴 Qoder 团队技术专家,目前专注于 Qoder CLI 产品研发工作,致力于提升开发者体验与生产力,探索大模型与工程实践的创新结合,为 AI 时代打造高效基础设施。
曾深度参与阿里巴巴 Kubernetes 容器、微服务产品研发多年,具有丰富的高可用架构设计、资源调度优化以及服务治理经验,近年来持续推动从云原生到 AI 原生应用架构的演进。
构建可理解界面、可执行任务的智能体:移动端 GUI Agent 技术拆解
2022 年加入去哪儿旅行,负责自动化测试、录制回放等工程提效工具建设,拥有丰富的复杂系统工程经验。自 2023 年起专注 AI 大模型应用,推动 AI 在测试与需求领域的规模化落地。曾获得去哪儿 AIGC Hackathon 冠军。现作为 AI 创新方向的负责人,主导基于视觉大模型的 GUI Agent 技术研发。
2025年【星空奖】发布
Agent时代下的代码评测范式革新
评测驱动可信:蚂蚁数科金融级智能体评测体系落地实践
蚂蚁数科AI业务质量与质量效能负责人,负责蚂蚁数科AI业务整体质量及质量效能平台建设工作,主导构建智能体评测平台&蚂蚁数科质量平台,覆盖从算法验证到业务交付的全链路质量管控。10余年软件开发及测试经验,擅长测试工具开发、质量效能平台建设等方向有丰富的落地经验,曾任职网易、淘宝、腾讯音乐等公司,个人累计申请多篇专利、软著。
让智能体更可信的Jeddak AgentArmor 技术挑战与落地实践(视频播放)
刘洋 博士,现任字节跳动技术专家,专注人工智能安全与隐私方向,主导多项大模型/智能体安全、联邦学习等项目的研发与落地,拥有NeurIPS、IJCAI、 IEEE/ACM ToN等20余项学术论文,以及40余项人工智能安全、大规模隐私计算基础设施相关的发明专利。毕业于清华大学、澳大利亚国立大学。
构建下一代Agentic AI应用的技术实践
超过7年协助跨国及本土大企业数字化转型,6年支持创业及中小公司客户实现高速增长。对网络,容器,微服务,机器学习方面有深层见解和研究。目前带领技术团队专注在利用生成式AI帮助创业及中小企业公司完成更多云原生创新项目的落地。
阿里云百炼Agent平台与智能体开源框架AgentScope
全栈开源 AgenticOS 的创业实践
清华大学经管学院 MBA,西安电子科技大学计算机系本科。2014 年创办宜创科技,目前已服务国内上百家大型技术团队和项目。宜创科技 2023 年开始专注在基于大模型 AGI 领域创新,已推出 ChatBI、ChatExcel、ChatPDF 等多个产品。目前,宜创科技正在构建全新的大模型中间层基 LLMFarm,个人智能助理 FriAI ,致力于帮助企业解决不能用、不会用、不好用的大模型开发的实际痛点,让中国企业都能以十分之一成本,利用 LLM 大模型落地各行业应用场景。
从工具到伙伴:OPPO AI智能体技术探索与实践
OPPO AI中心技术专家,从事智能体大模型与AI智能体的探索与应用工作。本科毕业于中国科学技术大学,博士就读于中科院大学。研究兴趣包括推荐系统、大模型与AI智能体等,相关研究成果在ACL、ICLR、AAMAS、WWW等国际会议发表论文10余篇,曾获得KDDCUP 2021第四名,ICLR2025 Spotlight等。开源的轻量化大模型 Hammer 系列已集成到谷歌 AI EDGE SDK,在 Huggingface 社区累计下载量达到10W+。
“云小二Aivis”的架构实践:基于上下文工程与多智能体的自主服务新形态
阿里云智能技术服务平台部智能技术组算法专家,负责阿里云服务领域Agent平台、多智能体协同等AI大模型技术在客户服务领域的落地。在阿里云服务领域深耕多年,曾负责服务领域大模型的训练调优、对话机器人链路体系的构建,逐步建设起了阿里云服务领域的算法技术体系和各类基础设施,主导构建了阿里云服务领域大模型、服务领域Agent/Multi-Agent技术、知识库问答、知识图谱、推荐系统等。
曾获得阿里云智能集团凌云奖、阿里云天池大数据算法竞赛冠军;曾以第一发明人发表发明专利6项;多次在阿里云开发者公众号发表AI技术文章,累计阅读量破10w+。
重塑办公数字员工:AI Agents 在 WPS 协作场景中的创新与实践
现任金山办公高级算法经理,负责智能体技术在 WPS 的落地。曾就职网易新闻与美团外卖,从事搜索、NLP、广告机制与推荐算法研发。现聚焦多智能体协作、推理奖励塑形与商业机制设计研究。
软件智能体构建过程中的一些原则经验分享 (远程演讲)
分布式系统专家,架构师,开源软件作者,知名开源 HTAP 数据库 TiDB 主要作者,曾就职于微软亚洲研究院,网易有道及豌豆荚。2015 年创业,成立 PingCAP,致力于下一代开源分布式数据库的研发工作,擅长分布式存储系统设计与实现,高并发后端架构设计。曾多次在 VLDB,HPTS 等数据库学术会议上发表论文或进行主题分享。作为第一作者在 VLDB 2020 发表论文《TiDB, A Raft-based HTAP Database》。
基于Flink的实时推理与Agent构建
DeepEye:一站式数据智能体系统架构解读
骆昱宇,现任香港科技大学(广州)助理教授、香港科技大学联署助理教授、博士生导师,数据智能与分析实验室负责人。研究兴趣为DATA+AI数智融合方向,包括数据为中心的人工智能(Data-centric AI, DCAI)、大模型智能体(Foundation Agents)、数据智能体(Data Agents)、智能数据库系统(AI for Databases)。 在研项目包括国家科技重大专项课题、国家自然科学基金青年项目等,在数据管理与数据挖掘(SIGMOD/VLDB/ICDE/SIGKDD/TODS)、机器学习(ICML/NeurIPS/ICLR)等领域发表 CCF-A 类论文 40余篇,也担任多个国际顶会的Associate PC Chair/Area Chair和IEEE Data Engineering Bulletin期刊副主编。他获得多个最佳论文/提名奖(如SIGMOD 2023, CIKM 2022, DASFAA 2019),领导或参与开源了多个DATA+AI系统(如DeepEye数据智能体开源;OpenManus智能体项目,Github 5万+Stars)。他曾获世界人工智能大会云帆奖、福布斯中国“30位30岁以下精英”榜、清华特等奖学金、华为火花奖、清华大学优博/优博论文奖/中国计算机学会优秀博士学位论文提名奖等。
开源 Data Engineering Agent 的成长之路
赵恒,Datus.AI 的创始人,StarRocks TSC member。从阿里的数据库开发工程师到多个开源项目的连续创业者。
华中科技大学计算机本硕,毕业在阿里巴巴从事分布式数据库开发,后在数据领域持续创业,曾获得德迅等VC的投资,最终公司被收购。近5年作为创始团队成员负责了开源数据库StarRocks从0到1的产品设计,并专注于北美数据分析市场的开拓和研究。
上下文工程新范式:构建自主决策 Agent 的智能数据基座
OceanBase obdiag SIG Maintainer,OceanBase 社区TOC 成员。从事OceanBase 数据库的生态建设工作,包括技术布道、AI 生态探索、开发者赋能、工具链优化等。
小米 GUI Agent 的思考和实践
北京大学心理与认知科学学院硕士行业导师,北邮101拔尖班企业导师,CCF YOSCEF总部学术委员,CCF大模型论坛执委,微软小冰初创成员。研究方向:人机对话、大语言模型和AI Agent。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,主导了小米MiLM系列基座模型训练。曾获23年小米百万美金技术大奖,24年CCF计算机应用创新技术一等奖,24年数博会优秀科技成果奖等,在国际顶级学术会议和杂志发表论文30余篇。
腾讯云 Data Platform 构建 Agent Memory Lake:让智能体拥有无限记忆
腾讯云存储首席技术专家,十多年分布式云存储技术和产品化经验。作为技术领头人,从事过网络、安全、存储等多个领域的技术工作。目前作为腾讯首席云存储技术专家,负责腾讯云存储的解决方案规划、设计和商业化工作。
客服领域Agent模型的内外兼修之道
在阿里主要负责客服Agent系统及其领域模型训练相关算法。前腾讯AILab算法,中国科学院数学与系统科学研究院博士。
可扩展、可个性化:面向 AI 创新应用的 Agent 核心能力探索
小红书中台算法组大模型应用算法专家,主要研究方向为 Agentic AI、Deep Research、LLM Personality 等,先后在 NeurIPS、ICLR、ACL、EMNLP 等发表论文 30 余篇。代表工作包括 Multi-Agent Debate、CipherChat、PsychoBench、DeepAgent 等。前腾讯 AI Lab 高级研究员,香港中文大学计算机科学与工程系博士。
灵光App 全模态通用AI助手—AGI时代的用户体验革新(视频播放)
胡越阳蚂蚁集团产品运营专家
面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进
之前曾参与百度小度音箱项目的开发上线工作,加入OPPO后负责过OPPO视频字幕业务上线及优化实施,目前负责OPPO AI搜索业务落地上线及优化工作。
GAM:从静态记忆到即时检索的通用智能体记忆架构
MemOS 记忆操作系统架构设计与关键技术挑战
李志宇 博士,记忆张量(上海)科技有限公司联合创始人兼CTO、上海算法创新研究院大模型中心技术负责人、研究员。长期从事预训练和大模型应用方向的研发技术攻关,主要研究方向包括大模型记忆增强、高效评估与应用算法。曾在阿里巴巴、小红书等头部科技企业带队承担多个核心算法方向,技术成果服务于商品评价、双十一大促、营销广告等超大规模业务场景,累计带来数十亿营收,影响用户近亿人次,并获得双十一技术突破奖。近年来,先后和团队提出了首个记忆分层的创新架构大模型,以及业内业内首个大模型记忆操作系统(MemOS),MemOS开源三个月累计获得Star数超3300+,开发者数超3000+,为大模型的记忆增强落地提供了可行的探索路径。相关大模型技术成果已在中国银行、招商证券、中国电信、新华社等多家国央企落地应用。当前已在 Patterns(Cell Press)、NeurIPS、ICLR、ACL和TKDE等国际会议期刊发表论文50余篇、引用超千次、授权专利 10 余项。现任中国中文信息学会信息检索专委会委员、大模型与生成专委会委员,相关研究工作入选《麻省理工科技评论》封面报道、《机器之心》、《量子位》和《PaperWeekly》的头条报道,并多次登顶Huggingface热点论文Top1。
EverMemOS:拒绝“金鱼记忆”,超越 RAG,打造 AI 的可成长“第二大脑”
邓亚峰,毕业于清华大学,正高级工程师,拥有二十余年人工智能算法及产品研发经验。现任EverMind CEO 兼 盛大集团副总裁。曾任360集团副总裁、人工智能研究院院长兼搜索事业部总经理,科创板首家AI上市公司格灵深瞳CTO。荣获2021年中国人工智能年度十大风云人物,教育部技术发明奖二等奖。长期致力于大语言模型、计算机视觉及AI for Science等领域的研究与应用,带领团队多次在国际国内主流AI评测中获得佳绩;累计申请发明专利160余项(已授权98项),发表论文50余篇(含10篇Nature子刊)。
如何让 Agent 真正记得住:基础模型视角下的 Agent 长期记忆工程
毕业于清华大学,资深AI技术专家。深耕计算机视觉、AI芯片及自动驾驶多年,2023年加入阶跃星程,负责大模型的技术研发工作,主导Step-Audio等项目,目前为Agent研发负责人,具备从底层硬件优化到上层Agent架构的全栈开发经验。累计获得50+项专利,在国际顶会发表多篇论文,擅长解决前沿领域的复杂算法及工程挑战。
简介 :
2022 年底,ChatGPT 刚把“对话”卷到天花板,工程师还没来得及鼓掌,投资人已经在问:它能不能动手?
六个月后,Plugins 出现,“大模型 + 工具”被写进无数 BP,可真正上到生产线的屈指可数——不是模型不行,是工程、成本、合规三座大山同时压下来。
又过了两个季度,Manus横空出世惊艳全球,2025年正式成为Agent元年。围绕Agent技术和生态的迭代进入加速期,128 k 长窗口、Multi-Agent 框架、MCP、A2A等像连珠炮一样此起彼伏,行业共识瞬间形成:谁先把 Agent 塞进核心系统,谁就能拿下下一代应用入口。
共识来得太快,踩坑却太碎——GPU/CPU 怎么切、RAG 还值不值得、工具失败率到底卡几位 9、长窗口成本曲线何时打平,每一题都直击上线节点。
于是我们把 18 个月的惊险冲刺浓缩成两天:不谈愿景,只交付能复制、可回滚、可量化的硬核方案,让工程师在下一个版本冻结前,把 Agent 从 Demo 搬进生产核心。