使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2 天沉浸式学习交流 | 8+前沿分论坛 | 32+真实应用案例
2022 年底,ChatGPT 刚把“对话”卷到天花板,工程师还没来得及鼓掌,投资人已经在问:它能不能动手?
六个月后,Plugins 出现,“大模型 + 工具”被写进无数 BP,可真正上到生产线的屈指可数——不是模型不行,是工程、成本、合规三座大山同时压下来。
又过了两个季度,Manus横空出世惊艳全球,2025年正式成为Agent元年。围绕Agent技术和生态的迭代进入加速期,128 k 长窗口、Multi-Agent 框架、MCP、A2A等像连珠炮一样此起彼伏,行业共识瞬间形成:谁先把 Agent 塞进核心系统,谁就能拿下下一代应用入口。
共识来得太快,踩坑却太碎——GPU/CPU 怎么切、RAG 还值不值得、工具失败率到底卡几位 9、长窗口成本曲线何时打平,每一题都直击上线节点。
于是我们把 18 个月的惊险冲刺浓缩成两天:不谈愿景,只交付能复制、可回滚、可量化的硬核方案,让工程师在下一个版本冻结前,把 Agent 从 Demo 搬进生产核心。
个人介绍:林伟,主攻大规模分布式训练加速、编译优化、大数据计算、分布式系统等技术工程建设和性能优化。具有17年的系统架构设计及研发经验,并在国际一流ODSI、NSDI、SIGMOD会议上多次发表论文。原微软大数据平台组的核心成员,曾在微软亚洲研究院和微软美国工作10年。
多年 IT、互联网工作经验,在基础平台架构与研发、金融分布式系统、金融科技探索与应用方面有丰富经验。负责度小满整体技术的规划与推进,以及信贷技术架构从1.0到4.0的演进,支持了业务多年数倍的持续增长。
在金融科技探索上,主导了区块链、复杂工程技术、虚拟现实、物联网技术、LLM的探索与应用落地;从0组建了百度第1个区块链研发团队,相关工作荣获了福布斯全球、哈佛商业评论、工信部等国内国际荣誉。推动与参与了多项国内国际标准的制定,以及白皮书、蓝皮书的攥写,个人累计申请了60多项国际、国内发明专利。
胡云华,西安交通大学和微软亚洲研究院联合培养博士,先后担任微软亚洲研究院副研究员、阿里巴巴达摩院资深算法专家、支付宝中国首席数据官、智谱华章副总裁,在搜索、广告、推荐、大模型研发、用户产品创新方面拥有丰富经验。
阿里云EMR研发团队负责人,资深技术专家,Apache Flink & HBase PMC Member,Apache软件基金会Member。
13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。
具有多年在传统数据库管理和大数据分布式平台开发与维护的专业背景。熟练掌握大数据技术,能够高效地进行批处理和流处理任务的设计和实施。对数据湖架构的构建和优化也有深入研究,能够帮助企业从海量数据中提取有价值的信息,支持数据驱动的决策制定。
目前在eBay作为数据平台研发总监,带领团队负责云原生的数据湖,分布式搜索引擎,调度系统,存算分离计算引擎,OLAP离线数据库,数据开发平台等技术的实施,优化,开发工作。
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
美的集团首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow IET Fellow ACM Distinguished Scientist。
吴友政博士,京东科技集团语音语义算法部负责人、高级总监。博士毕业于中国科学院自动化研究所,毕业后在日本情报通信研究机构、英国爱丁堡大学、索尼中国研究院和爱奇艺负责自然语言处理、语音识别、机器翻译等前沿技术研究和产品研发工作,在国际自然语言处理顶会和期刊(如ACL、NAACL、EMNLP、AAAI、ICASSP等)上发表多篇学术论文。曾获得语音识别(IWSLT2012、IWSLT2013)和对话式机器阅读理解(QuAC 2020)比赛的冠军。连续2年主办京东人机对话挑战赛。技术产品化上,带领团队打造了基于多轮对话技术的智能客服平台言犀、基于多模态内容生成技术的品创等产品。曾获得京东集团技术金牛奖等荣誉。
企业架构和数字化转型专家,北京大学理学硕士,银行、保险、车企20年工作经验,《企业架构驱动数字化转型》作者,“金融IT那些事儿”公众号主理人。
阿里云AI搜索研发负责人,负责阿里云AI搜索产品OpenSearch、阿里云ElasticSearch AI研发,以及开源搜索引擎Havenask研发。覆盖AI搜索、向量检索、大数据检索、对话式搜索等多个场景。带领团队研发多款搜索、推荐和智能问答类产品研发。目前主要聚焦在大模型AI搜索研发,关注大模型AI搜索对业务和客户的价值。
AI数据生产(标注、数据集、合成)、AI安全(评测、防御)、AI软硬件一体、AI营销相关领域从业者。
企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。
阅文集团技术副总经理,AIGC负责人,腾讯云最具价值专家、复旦大学计算机学院专业硕士导师。有着近15年的人工智能、大数据研发管理经验。在AIGC、个性化推荐、搜索、大数据挖掘、自然语言处理等领域都有丰富的实践经验。目前主导人工智能技术在集团内部的研发和应用落地,带领团队研发了阅文妙笔大模型和多模态大模型,并在作家辅助创作、角色对话、增长素材和机器翻译等大模型应用场景上也取得了不错的成果。对内容业务有深刻理解,也主导推进智能风控、推荐系统、反盗版等公司重点项目落地。曾任百度人工智能事业部技术经理,负责过百度推荐、精准广告、图片搜索、大数据商业化等项目。
胡月军,现任 ProtonBase 技术副总裁,从事存储与计算引擎的设计与研发工作,致力于打造 AI 时代云原生一体化的数据存储,计算和管理系统。曾任阿里巴巴计算平台事业部资深技术专家,发起和参与了阿里巴巴交互式分析引擎 Hologres 的研发。在此之前,从事5年搜索和广告引擎的设计与开发,负责过阿里巴巴淘宝、天猫、1688、Sourcing 和 AliExress 的搜索与广告在线引擎系统,主导过阿里巴巴国际搜索和广告引擎在离线的一体化升级改造。
Agent Foundation Model | Agent Dev Tool | 面向 Agent 的数据工程系统 |
|
|
|
面向 Agent 的记忆工程 | Agent 可信治理 | AgentOS内核与落地实战 |
|
|
|
DataAgent | 专业助手Agent | 自主决策Agent |
|
|
|
中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注AI技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。
毕业于中国科学技术大学,获得计算机科学博士学位。随后加入理光研究院,并在亚利桑那州立大学(ASU)担任博士后研究员。2014年回国加入阿里巴巴,历任蚂蚁集团风控科技总监。现为蚂蚁数字科技AI技术负责人。
清华大学经管学院 MBA,西安电子科技大学计算机系本科。2014 年创办宜创科技,目前已服务国内上百家大型技术团队和项目。宜创科技 2023 年开始专注在基于大模型 AGI 领域创新,已推出 ChatBI、ChatExcel、ChatPDF 等多个产品。目前,宜创科技正在构建全新的大模型中间层基 LLMFarm,个人智能助理 FriAI ,致力于帮助企业解决不能用、不会用、不好用的大模型开发的实际痛点,让中国企业都能以十分之一成本,利用 LLM 大模型落地各行业应用场景。
熊飞宇,华中科技大学本科,美国 Drexel University博士,上海算法创新研究院大模型中心负责人。长期专注于基本原理驱动的系统性创新,以“低成本、低幻觉、高泛化”为核心,探索适合中国国情的大模型发展和AI应用落地的新路径。自主研发基于记忆分层架构的“忆3”和记忆操作系统 MemOS,已实现商业化落地,业绩稳健增长,获得招商证券、中国银行、中国电信等头部国央企认可。曾任阿里巴巴集团业务中台数据智能负责人、淘宝天猫集团数据平台负责人,成功构建国内首个千亿级数字商业知识图谱及知识交互的零售行业大模型,荣获浙江省科技进步奖等多个奖项,并在人工智能顶级会议和期刊发表多篇学术论文。
蚂蚁财富投研支小助技术负责人、AntAlpha 投研量化平台技术负责人。曾任 DecentGalaxy 量化基金技术合伙人、青岛基金协会特邀专家、中国海洋大学社会讲师。长期致力于经典量化投研、人工智能算法、大模型多智能体技术与金融研究的有机结合与平台化探索。
李国良,清华大学教授,计算机系副主任,博士生导师,国家杰出青年科学基金获得者,IEEE Fellow,openGauss 社区技术委员会主席。在数据库领域顶级会议和期刊上发表论文200余篇,他引18000余次,入选爱思唯尔2014-2024年中国高被引学者榜单。主持国家杰出青年基金、优秀青年基金、青年973、自然基金重点等项目。获得了VLDB 2017 Early Career Research Contributions Award(VLDB青年贡献奖,亚洲首位获奖者)、IEEE TCDE Early Career Award(IEEE 数据工程领域杰出新人奖,亚洲首位获奖者)、青年长江学者、“万人计划”青年拔尖、计算机学会青年科学家奖、教育部新世纪优秀人才等奖项。担任VLDB Journal、IEEE TKDE等编委,SIGMOD 2021大会主席,VLDB 2021 Demo 主席,ICDE 2022 Industry Chair, 多次担任SIGMOD、VLDB、KDD、ICDE、WWW、IJCAI、AAAI等会议的程序委员会委员。获得过数据库领域重要国际会议SIGMOD23、VLDB23、VLDB20、KDD18、ICDE18最佳论文提名,VLDB23工业界最佳论文亚军,SIGMOD24 研究亮点奖,DASFAA23最佳论文、CIKM’17的最佳论文奖、DASFAA’14的最佳论文提名奖、APWeb’14最佳论文奖、EDBT’13大数据比赛冠军。获国家科技进步二等奖(2018)、江苏省科技进步一等奖(2019)、电子学会科技进步一等奖(2022)、CCF科技进步特等奖(2022)。
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
杨玉庆博士现任微软亚洲研究院首席研发经理,负责领导上海系统组,专注于大模型系统与智能体系统的研究工作。他的研究兴趣包括大规模语言模型的高效计算与推理,尤其关注长上下文模型的推理加速;以及智能体的系统设计与优化,包括面向智能体的系统调度优化、多轮强化学习系统与算法等。他的相关研究成果已多次发表在OSDI、SOSP、EuroSys、ATC、CVPR、ICCV、NeurIPS等国际顶级学术会议上。杨玉庆博士于2006年和2011年分别获得复旦大学学士与博士学位。
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
北京大学心理与认知科学学院硕士行业导师,北邮101拔尖班企业导师,CCF YOSCEF总部学术委员,CCF大模型论坛执委,微软小冰初创成员。研究方向:人机对话、大语言模型和AI Agent。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,主导了小米MiLM系列基座模型训练。曾获23年小米百万美金技术大奖,24年CCF计算机应用创新技术一等奖,24年数博会优秀科技成果奖等,在国际顶级学术会议和杂志发表论文30余篇。
清华大学经管学院 MBA,西安电子科技大学计算机系本科。2014 年创办宜创科技,目前已服务国内上百家大型技术团队和项目。宜创科技 2023 年开始专注在基于大模型 AGI 领域创新,已推出 ChatBI、ChatExcel、ChatPDF 等多个产品。目前,宜创科技正在构建全新的大模型中间层基 LLMFarm,个人智能助理 FriAI ,致力于帮助企业解决不能用、不会用、不好用的大模型开发的实际痛点,让中国企业都能以十分之一成本,利用 LLM 大模型落地各行业应用场景。
10年+的数据仓库从业经历,先后就职于京东、阿里、快手,在数据仓库建设、数据仓库治理方面积累了丰富经验,热衷于探索AI在数据仓库中的应用。
阿里云智能技术服务平台部智能技术组算法专家,负责阿里云服务领域Agent平台、多智能体协同等AI大模型技术在客户服务领域的落地。在阿里云服务领域深耕多年,曾负责服务领域大模型的训练调优、对话机器人链路体系的构建,逐步建设起了阿里云服务领域的算法技术体系和各类基础设施,主导构建了阿里云服务领域大模型、服务领域Agent/Multi-Agent技术、知识库问答、知识图谱、推荐系统等。
曾获得阿里云智能集团凌云奖、阿里云天池大数据算法竞赛冠军;曾以第一发明人发表发明专利6项;多次在阿里云开发者公众号发表AI技术文章,累计阅读量破10w+。
于中国科学院计算技术研究所获得博士学位。他的研究方向涵盖大语言模型、多模态大模型、AI for Data Science。相关研究成果在 NeurIPS、ACL、ICLR 等国际人工智能与自然语言处理会议发表论文30余篇,开源的多语言大模型、多模态大模型、数据科学大模型在 GitHub 社区累计获得7000+星标。他长期担任 CCF-A 类国际会议 ACL ARR 的领域主席和责任编辑。个人主页:zhangshaolei1998@github.io。
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
AskTable 创始人,前阿里云 PolarDB 创始人之一。前火山引擎数据库产品负责人。
赵恒,Datus.AI 的创始人,StarRocks TSC member。从阿里的数据库开发工程师到多个开源项目的连续创业者。
华中科技大学计算机本硕,毕业在阿里巴巴从事分布式数据库开发,后在数据领域持续创业,曾获得德迅等VC的投资,最终公司被收购。近5年作为创始团队成员负责了开源数据库StarRocks从0到1的产品设计,并专注于北美数据分析市场的开拓和研究。
北航卓越青年学者,主要研究领域涵盖自然语言理解与生成、大模型预训练与微调、代码智能、代码安全等。在ICLR、NeurIPS、ICML、ACL、EMNLP、NAACL、AAAI、IJCAI等发表论文和报告论文百余篇,其中第一作者/通讯作者20余篇,谷歌学术引用14000+次,并担任NeurIPS、ARR (ACL、EMNLP、NAACL)、AAAI-AIA等国际会议的领域主席(Area Chair,AC)和高级程序委员会委员(Senior Program Committee,SPC),以及期刊Electronics特刊客座编辑。
博士期间作为北京航空航天大学与微软亚洲研究院联合培养博士生代表微软参与世界超大规模多语言机器翻译(WMT2021)三项赛道比赛第一,毕业后在阿里巴巴任职期间(入选阿里星计划),作为通义千问(Qwen)及通义千问代码大模型的QwenCoder系列的核心贡献者,参与千问模型代码能力建设及专项千问代码大模型系列研发(已成为学术界常用基线模型,github数千星)。此外,作为国内知名大模型开源组织M-A-P的主要贡献者,开源若干大模型基座模型,包括全开源代码大模型OpenCoder等。
OPPO AI中心技术专家,从事智能体大模型与AI智能体的探索与应用工作。本科毕业于中国科学技术大学,博士就读于中科院大学。研究兴趣包括推荐系统、大模型与AI智能体等,相关研究成果在ACL、ICLR、AAMAS、WWW等国际会议发表论文10余篇,曾获得KDDCUP 2021第四名,ICLR2025 Spotlight等。开源的轻量化大模型 Hammer 系列已集成到谷歌 AI EDGE SDK,在 Huggingface 社区累计下载量达到10W+。
中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注AI技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。
之前曾参与百度小度音箱项目的开发上线工作,加入OPPO后负责过OPPO视频字幕业务上线及优化实施,目前负责OPPO AI搜索业务落地上线及优化工作。
缪旭博士,九章云极DataCanvas公司AI首席科学家,是人工智能领域的杰出布道师。
毕业于华盛顿大学,拥有超过二十年的AI研究与管理经验,长期深耕于AI技术的实现与应用,特别是在AI人机交互方式的探索与落地方面,取得了卓越成就。
学术造诣深厚,在ACM SIG KDD、IJCAI、IJCV、NeurIPS及Neural Computation等国际顶级期刊与会议上,发表多篇具有影响力的学术论文,并拥有授权美国发明专利10余项。不仅展现其在AI领域的深厚底蕴和卓越创新精神,更为AI技术的发展和应用提供了有力支撑。
曾在微软研究院和LinkedIn等国际知名企业担任研究员等重要职务,曾成功创办Astound.ai、Reasoned.ai等多家高科技公司,专注于将可推理可解释的人工智能、大模型、大规模实时机器学习、情感计算等前沿AI技术加速应用于各行各业,推动AI技术的商业化进程。
于2023年入选国家启明计划,目前作为九章云极DataCanvas的AI首席科学家,继续引领公司在AI技术的研发与应用方面不断突破,为推动AI技术的创新与发展贡献力量。
现任金山办公高级算法经理,负责智能体技术在 WPS 的落地。曾就职网易新闻与美团外卖,从事搜索、NLP、广告机制与推荐算法研发。现聚焦多智能体协作、推理奖励塑形与商业机制设计研究。
刘洋 博士,现任字节跳动技术专家,专注人工智能安全与隐私方向,主导多项大模型/智能体安全、联邦学习等项目的研发与落地,拥有NeurIPS、IJCAI、 IEEE/ACM ToN等20余项学术论文,以及40余项人工智能安全、大规模隐私计算基础设施相关的发明专利。毕业于清华大学、澳大利亚国立大学。
超过7年协助跨国及本土大企业数字化转型,6年支持创业及中小公司客户实现高速增长。对网络,容器,微服务,机器学习方面有深层见解和研究。目前带领技术团队专注在利用生成式AI帮助创业及中小企业公司完成更多云原生创新项目的落地。
蚂蚁数科AI业务质量与质量效能负责人,负责蚂蚁数科AI业务整体质量及质量效能平台建设工作,主导构建智能体评测平台&蚂蚁数科质量平台,覆盖从算法验证到业务交付的全链路质量管控。10余年软件开发及测试经验,擅长测试工具开发、质量效能平台建设等方向有丰富的落地经验,曾任职网易、淘宝、腾讯音乐等公司,个人累计申请多篇专利、软著。
深耕K8s容器、微服务架构多年,现专注AI原生应用技术,探索大模型与工程实践的创新结合。目前主导 Qoder CLI 产品研发,致力于提升开发者体验与生产力,为AI时代打造高效基础设施。
在阿里主要负责客服Agent系统及其领域模型训练相关算法。前腾讯AILab算法,中国科学院数学与系统科学研究院博士。
2022 年加入去哪儿旅行,负责自动化测试、录制回放等工程提效工具建设,拥有丰富的复杂系统工程经验。自 2023 年起专注 AI 大模型应用,推动 AI 在测试与需求领域的规模化落地。曾获得去哪儿 AIGC Hackathon 冠军。现作为 AI 创新方向的负责人,主导基于视觉大模型的 GUI Agent 技术研发。
智驱未来:以 Agent 为北极星的科技演进与投资新范式
人工智能正成为驱动未来科技发展与文明演进的核心引擎,AI的影响远超常规认知,正深刻渗透至芯片、脑机接口及制造业无人化等硬核领域,引发供给端的效率革命。
本次演讲将解析AI技术从“理解”迈向“推理”,并最终进化为“智能体”的关键趋势。同时,也会勾勒AI投资的时间主线,并对比海内外商业化生态:海外市场在环境友好度和模型能力上领先,而国内市场则面临同质化竞争。
智能体原生的学习框架Agent Lightning从设计到落地实践
智能体正在从“静态决策器”走向“可持续进化的学习系统”。然而,当前的智能体框架、模型服务系统与学习算法高度割裂,使得在线学习、跨任务适应、记忆演化和行为优化变得异常困难。Agent Lightning旨在解决这一核心瓶颈。我们提出了智能体原生(agent-native)的学习框架,包括统一经验数据层,以标准化格式捕获和组织智能体的交互、轨迹、反馈与工具调用,为各种学习算法直接提供高质量的经验数据;Agent–Optimizer解耦架构,将智能体执行从学习机制中彻底分离,使提示优化、记忆更新、检索调优乃至模型微调都可模块化接入;在线学习算法探索,面向长时序推理、稀疏或延迟反馈、多步骤决策等关键难题,设计更适合真实场景的学习策略;跨场景性能优化,使服务性能、能力演化和实际业务价值形成正反馈闭环。
本次分享将系统介绍Agent Lightning的设计思路、技术架构、核心算法、工程实践与最新进展,展示如何让智能体真正从经验中变得更聪明。
DeepAnalyze:大模型到数据科学家的 Agentic 进化之路
随着数据量爆炸式增长,数据科学家将大量时间耗费在数据清洗、建模与可视化等重复性工作上。我们团队探索“AI for Data Science”的新方向,提出并开源了全球首个面向数据科学的Agentic LLM——DeepAnalyze。不同于传统的workflow-based方案,DeepAnalyze通过真实场景下的agentic training,使模型具备“自主思考与行动”的能力,可像人类分析师一样独立完成数据准备、分析、建模与洞察。项目开源后迅速获得社区关注,GitHub Star超1500,显著提升数据分析效率与智能化水平。我们相信,DeepAnalyze标志着数据科学正从“自动化工具”迈向“智能协作伙伴”的关键进化。
本次报告将全面解析 DeepAnalyze 的核心技术路线,展示其如何让 AI 真正成为数据科学家的智能助手,并为AI驱动的数据分析未来带来全新启发。
演讲提纲:
一、业务背景与研究动机
1. 数据科学的瓶颈:分析师时间大量消耗在数据清洗、特征工程与可视化等低效环节。
2. 现有自动化方案的局限:Workflow-based Agent 需精细prompt工程、缺乏泛化能力与适应性。
3. 研究愿景:构建能够自主理解、决策与执行数据分析任务的 Agentic LLM,实现从“自动化”到“智能化”的跃迁。
二、方案选型与系统设计
1. 理念提出:以“Agentic LLM”替代传统workflow,让模型具备自主规划与任务执行能力。
2. 技术架构:Agentic LLM
3. 训练策略:在真实环境中进行强化学习式训练。
4. 数据合成:覆盖结构化与非结构化数据分析任务。
三、落地挑战
1. 复杂任务拆解与上下文依赖:如何让模型在长链推理中保持一致性与可解释性。
2. 数据安全与隐私保护:在开放环境下处理真实业务数据的安全策略。
3. 性能与资源权衡:平衡自主决策能力与计算成本。
四、核心解决思路
1. 任务自演化机制:通过自我反思与重规划(replanning),实现多阶段数据任务的自主推进。
2. 可微调的领域适配框架:允许在金融、医疗等垂直领域进行轻量化再训练。
3. 工具协同体系:构建统一的“数据科学工具API层”,提升Agent与外部分析环境的协作效率。
五、应用成效与社区反馈
1. 开源成果:模型、代码、Demo 全面开放,支持本地部署。
2. 社区反响:GitHub Star 超1500,形成多领域开发者生态。
3. 效果验证:在多类真实数据分析任务中,DeepAnalyze 显著优于传统自动化Pipeline方案。
六、未来规划
1. Agentic LLM范式研究:推动AI从任务执行者向智能研究者演进。
2. 跨领域协同分析:拓展至多模态数据(文本、表格、时序、图像)的统一分析。
3. 开放协作生态:与高校、企业共建Agentic数据科学平台。
七、总结与启发
1. 关键观点:DeepAnalyze 展示了AI驱动数据科学的“自主智能”方向。
2. 技术启示:Agentic训练是LLM走向专业领域能力化的关键路径。
3. 愿景展望:让AI真正成为数据科学家的合作伙伴,而非仅仅是工具。
听众收益:
1. 认知升级:理解“Agentic LLM”的范式转变
听众将深入理解从传统“Workflow-based Agent”到“Agentic LLM”的演进逻辑,认识AI如何从被动执行工具进化为具备自主规划与反思能力的智能体,为AI在数据科学中的角色转型提供全新思路。
2. 方法启发:掌握AI驱动数据分析的新路径
通过DeepAnalyze的技术路线与训练框架,听众能系统性了解如何构建具备数据理解、建模、分析和可视化全流程能力的智能系统,为企业或研究机构探索AI自动化分析方案提供可复用的技术参考。
3. 实践借鉴:获得可落地的系统实现经验
听众可借鉴DeepAnalyze在落地过程中的架构设计、Agentic training策略及任务自演化机制,提升对AI在真实业务场景中“从原型到产品”的实现路径的理解,助力自身项目在智能化方向上突破。
打造沉浸式的 Vibe Analyzing 体验——AI 驱动的数据分析新交互
在传统的数据分析流程中,分析师需要在复杂的报表、SQL 与图表工具间切换,体验割裂、效率低下且门槛高。AskTable(察言观数)基于 Agent 技术,重构了数据分析交互:通过自然语言提问、AI 自动生成 SQL、表格与图表,并以沉浸式的「AI 数据画布」界面,带来连续、直观的分析体验。
演讲提纲:
- 传统分析体验的痛点与局限
- AskTable 的 Agent/Data 技术基建
- 沉浸式 AI 数据画布的设计理念
- Vibe Analyzing 的落地案例
从对话到洞察:Agentic NL2SQL驱动的智能数据分析引擎
本次分享主要介绍阿里云PAI平台的智能数据分析引擎构建及其在阿里云dataworks产品中的落地。通过NL2SQL模型后训练(指令微调+RL)、智能体架构设计,实现自然语言到SQL生成、自动图表与智能报告的全流程闭环。结合ChatBI场景典型案例,将复杂分析简化为对话交互,显著提升业务决策效率与用户体验。
AI Agent在快手生活服务数据中心的探索及应用
各公司数据仓库建设或多或少都会遇到“烟囱式建设”、“数据质量”等一系列问题,所以数仓架构师会制定各种规范,包括“分层规范”、“命名规范”、“代码规范”等,但是因为人的因素,这些规范又执行不到位,不能从根本上解决问题,Agent的出现为这些问题提供了新的解决思路。快手生活服务中心探索了“智能评审”、“智能DQC”等AI Agent,提升了数仓建设的质量。
演讲提纲:
1、数仓模型设计、开发过程中存在什么质量痛点?
2、AI Agent如何提升模型设计、开发的质量?
3、数仓相关AI Agent的设计思路与实现细节
听众收益:
1、如何利用Agent解决数据仓库中烟囱式建设问题
2、Agent如何和数仓生产流程相结合
从代码大模型到通用代码智能体
代码基础模型——那些基于海量代码库预训练的大语言模型——已经在代码生成、理解和补全方面展现出卓越能力,但它们的真正潜力在于与代码智能体和工具的深度融合。我们正在经历一场范式转变:从独立的代码模型,发展到能够与编译器、调试器、API及外部资源动态交互的工具增强型智能体系统。
这些智能体不仅能够进行规划和推理,还能自主执行任务、迭代优化、自我调试。像Cursor这样的AI驱动编辑器和GitHub Copilot这样的AI结对编程工具,就是最典型的代表——它们将基础模型的强大能力与上下文感知、实时反馈相结合,实现了IDE内的自动化操作、语义化代码导航和意图驱动的代码合成。当然,这个领域也面临着可靠性保障、工具依赖处理、计算开销优化等挑战,我们需要通过微调、提示工程、符号-神经混合架构等方案来解决。
更令人兴奋的是,以光标为中心的智能体框架等新兴范式,让模型能够动态交互代码上下文、用户输入和IDE状态,真正实现人机无缝协作。展望未来,从自动化软件工程到自适应DevOps管道,从智能体专业化到人机交互伦理,这个领域还有巨大的探索空间。
总而言之,代码智能体与工具的协同正在重塑软件开发模式,大幅降低复杂编程任务的门槛,加速我们从自然语言描述到健壮可执行系统的转变——这是一场真正的变革。
演讲提纲:
一、背景介绍
代码基础模型正在改变软件开发方式
基础模型在代码生成、理解、补全方面的卓越表现
二、核心观点:真正潜力在于融合
代码智能体:具备规划、推理、执行能力的自主系统
代码工具:通过智能自动化增强开发工作流
深度融合带来的协同效应
三、范式转变
从:独立的代码模型
到:工具增强型智能体系统
关键能力:与编译器、调试器、API、外部资源动态交互
智能体特性:迭代优化、自我调试
四、典型应用案例
Cursor:AI驱动编辑器
GitHub Copilot:AI结对编程工具
实现功能:
IDE内自动化操作
语义化代码导航
意图驱动的代码合成
五、面临的挑战
可靠性保障
工具依赖处理
计算开销优化
六、解决方案
微调技术
提示工程
符号-神经混合架构
七、新兴范式:以光标为中心的智能体框架
动态交互能力:代码上下文、用户输入、IDE状态
目标:实现人机无缝协作
八、未来展望
自动化软件工程
自适应DevOps管道
智能体专业化
人机交互伦理
工具在缓解模型幻觉中的作用
九、总结:变革性影响
重塑软件开发模式
降低复杂编程任务门槛
加速从自然语言到可执行系统的转变
听众收益:
一、知识层面技术认知升级
- 全面了解AI辅助编程的最新技术趋势和发展方向
- 理解代码基础模型、智能体、工具增强等核心概念
- 掌握从传统开发到AI辅助开发的技术演进路径
- 建立对行业前沿技术的系统性认知框架
- 技术对比视角
- 清晰认识传统开发模式与AI增强开发的本质差异
- 了解不同AI编程工具(Copilot、Cursor等)的特点和适用场景
- 理解各种技术方案的优劣势和选择标准
二、实践层面落地实施指南
- 获得可操作的技术落地路线图(3-6-12个月计划)
- 了解如何将AI工具集成到现有开发流程
- 掌握IDE配置、工作流设置的具体方法
- 学习提示工程和上下文管理的实用技巧
三、效率提升开发效率
- 代码编写速度提升60-80%的实现路径
- Bug修复效率提升3倍的工作方式
- 单元测试、文档编写等重复性工作的自动化方案
- 从需求到代码的转化时间大幅缩短学习效率
- 快速上手新技术栈和框架的方法
- 减少50%新人培训时间的实践经验
- API文档查找和代码理解的智能化途径
四、职业发展技能竞争力
- 掌握行业最前沿的开发工具和方法
- 建立AI时代程序员的核心竞争力
- 了解未来5-10年软件开发的趋势方向
- 获得技术转型和职业规划的参考依据
通义多模态、多端 GUI 智能体 Mobile-Agent 实践
随着多模态大模型和AI Agent技术的快速发展,围绕Mobile、PC等端侧构建多模态GUI智能体,以进行自动化操作,成为了现在业界最热的研究应用方向之一,有望变革新的人机交互方式。
我们围绕多智能体架构、复杂任务拆解、自主进化推理、GUI基础模型等技术构建整个通义多模态、多端智能体Mobile-Agent技术体系,包括多模态单智能体Mobile-Agent、多模态多智能体Mobile-Agent-V2、自主进化多模态智能体Mobile-Agent-E、基础GUI智能体Mobile-Agent-v3等,并探索相关技术在手机、车机等多个场景的应用。
Mobile-Agent工作也发表在NeuIPS 2024,并获得CCL2024、2025 Best Demo,相关代码均已开源到Github (https://github.com/X-PLUG/MobileAgent)
演讲提纲:
1. 大模型智能体背景
2. 多模态多端智能体Mobile-Agent
3. Foundation Agent for GUI
4. 开源应用
OxyGent:构建高效能多智能体系统的协作框架
构建专业级智能体:从开发工具到产业实践的技术闭环
在专业智能体的开发过程中,开发效率与落地效果的平衡始终是核心挑战。九章云极DataCanvas通过自研的智能体开发工具链,实现了从智能体构建、优化到部署的全链路技术突破。
本次演讲将深入分享我们如何通过"智能体创建智能体"的技术路径,结合强化学习与工具化平台,显著提升企业级智能体的开发效率与事实准确性。同时,将结合金融、科研等典型场景,展示智能体开发工具在实际业务中的量化效果,为开发者提供可复用的方法论与实践经验。
演讲提纲:
1. 智能体开发的技术瓶颈与突破路径
- 专业智能体开发的三大挑战:准确性保障、开发效率、业务适配
- 九章云极的解决思路:工具化平台+强化学习的双轮驱动
2. 智能体开发工具链的核心架构
- Agent工厂:自然语言驱动的智能体构建
- 优化引擎:基于强化学习的事实准确性提升(54.2%提升实践)
- 知识库集成:多模态上下文赋能机制
3. 企业级智能体的落地实践
- 金融领域:从商业分析到战略决策的分钟级部署
- 科研场景:Aladdin平台如何提升算力利用率300%-400%
- 案例剖析:智能体开发工具在复杂业务中的量化效果
4. 未来展望:智能体开发工具的演进方向
- 跨平台协作与生态构建
- 低代码与专业开发的融合趋势
听众收益点:
1. 将了解如何通过“工具化平台+强化学习”的技术组合,系统性地解决专业智能体开发中面临的准确性、效率与业务适配难题,学习从构建、优化到部署的全链路实践思路。
2. 了解来自金融、科研等前沿领域的量化实战经验,为听众在自己的领域内规划与落地智能体应用提供可衡量的参考基准和决策依据。
3. 了解智能体开发工具在低代码、跨平台协作等方面的未来发展方向,有助于提前布局技术栈,把握与智算生态协同发展的新机遇。
AI编程中的轻量级智能实践
在AI编程工具日益“重型化”的今天,大家是否陷入了“算力军备竞赛”的误区?当焦点都集中在IDE插件的功能叠加时,Qoder深入命令行这一开发者最原始、最核心的阵地,进行了一场关于“效率”的深度思考。
本次演讲,我将分享Qoder CLI背后的技术哲学与实践,例如我们是如何设计一个内存消耗降低70% 的轻量级Agent框架,如何实现代码审查效率提升50%而质量翻倍的算法优化,以及我们为何坚信 “IDE + CLI”的双引擎模式是未来开发界面的主流。演讲的核心是,介绍如何通过架构设计、算法创新和生态集成,在AI时代为开发者“减负增效”的技术过程。
演讲提纲:
一、技术战略
AI编程工具在资源消耗、上下文局限与工作流断裂上的普遍问题
Qoder为何选择CLI作为突破口——并非放弃IDE,而是构建“双引擎”
二:Qoder CLI的核心技术拆解
1. 轻量级Agent框架的设计之道
2. Quest模式:从“人驱动”到“目标驱动”的编程
3. 智能代码审查的算法内核
三:与开发生态共融的技术路径
MCP 协议允许开发者自定义和扩展Qoder CLI能力
“Vibe Coding”的工程化实现
四:轻量级智能的未来
通过技术架构和创新算法实现降维打击。
轻量级智能在云原生、边缘计算场景下的巨大潜力
听众收益点:
1. 了解一个高性能、低消耗的AI编程Agent框架应如何设计,获得在资源受限环境下进行AI应用开发的思路。
2. 获取智能代码审查、任务自动化分解等核心功能的前沿算法思想与实践经验,可直接借鉴到自身的开发或研究工作中。
3. 深入理解“IDE+CLI”双模式、轻量级智能的未来发展趋势,为个人技术规划或团队技术选型提供有价值的参考。
构建可理解界面、可执行任务的智能体:移动端 GUI Agent 技术拆解
在移动互联网的“孤岛效应”下,应用间缺乏互通的 API 使得复杂跨应用任务难以自动化。传统的基于控件树(View Tree)和规则的 RPA 方案在面对动态布局、非标准控件及复杂业务逻辑时显得捉襟见肘。
本演讲将分享一套基于多模态大模型(VLM)驱动的 GUI Agent 架构。我们将探讨如何利用 AI 赋予 Agent 像人类一样“看懂”屏幕的能力,如何在没有 API 的情况下进行跨 App 的复杂操作,以及在实际工程落地中,如何解决推理延迟、幻觉控制及上下文记忆等核心挑战。
演讲提纲:
1. 背景与痛点:为何我们需要 GUI Agent?
- 移动端的“黑盒”现状: API 缺失与 App 间的数据孤岛。
- 传统自动化的局限: 这里的“脆性”问题(UI 改版即挂、DOM 树获取失败)。
2. 核心架构设计:模拟人类的操作流
- 感知层 (Perception):
双流感知机制: 结合 结构化数据 与 视觉快照。
语义对齐: 如何将屏幕截图中的像素坐标映射为可操作的语义元素。
- 规划层(Planner):
将复杂任务拆成多个任务的集合。
- 思考层 (Reasoning):
任务拆解: 结合上下文和当前情况,对当前状态和下一步操作做出准确判断。
反思机制: 当操作失败(如弹窗广告、加载失败)时的自我修正策略。
- 执行层 (Action):
动作空间定义: 点击、滑动、输入、返回、跨 App 切换。
3. 关键技术难点攻克
- 多步骤任务中的稳定性
- 如何平衡成功率,成本与速度
4. 实际效果与未来展望
听众收益:
1. 架构参考:获得一套完整的、可落地的移动端 GUI Agent 技术架构图。
2. 方案避坑:了解在处理复杂任务时的具体工程技巧。
3. 前沿视野:理解多模态大模型在 UI 自动化领域的最新应用范式。
开源 Data Engineering Agent 的成长之路
演讲提纲:
- AI时代数据工程的挑战
- Datus Agent的架构设计
- Datus Agent的实战与落地
- Data Engineering Agent的未来发展
听众收益:
- 理解Data Engineering Agent 的核心理念与价值,认识数据工程从“建表和跑数”向“可交付的SubAgent”转变的趋势。
- 学会如何从表、指标、SQL历史中自动构建数据上下文(Data Context),提升 NL2SQL / 分析问答的准确性与可落地性。
- 理解如果通过feedback loop持续构建可提升的 Data context 和 模型。
评测驱动可信:蚂蚁数科金融级智能体评测体系落地实践
当前智能体评测面临多重挑战,包括任务复杂性导致的行为不确定性,以及评估方法的局限性。尤其在金融场景下,对性能稳定性、决策可解释性、安全合规性及伦理风险控制的要求更为严苛。因此,亟需构建科学化的评估框架,通过量化性能、效果和安全等维度,实现系统化评测,以提升智能体在企业级应用中的可靠性和落地效果。
本次分享重点探讨以智能体为核心的评测体系构建,阐述在AI Agent驱动的业务应用中通过性能、效果、安全等核心环节实现智能体的深度评测与优化,我们将结合银行、保险等金融场景实践,实现Agent的深度评测与持续优化,并输出可复用的质量保障范式,助力智能体在严谨行业的安全、高效、规模化落地。
演讲提纲:
1、智能体质量保障的挑战和重要性
2、智能体质量保障的整体方法策略
3、智能体效果评测的方法和标准
4、一站式智能体评测平台建设
5、总结+未来展望
听众收益:
1. 掌握企业级AI Agent评测的核心方法论
理解如何科学评估Agent能力,告别“黑盒式验收”,为技术选型、供应商评估和项目决策提供可量化、可交付的依据——尤其适用于金融、政务等高敏场景。
2. 获得可复用的评测工具链与工程实践
深入学习评测数据构造、评测体系建立、评测智能体、效果归因分析等关键技能,了解高质量评测平台的设计逻辑,助你快速搭建适配自身业务的智能体评测基础设施。
3. 带走一套“理论+实战”融合的评测框架
基于蚂蚁数科在银行、保险等真实场景的落地经验,提供从评估标准定义到工具链建设的完整路径,让你不仅能“看懂评测”,更能“建得起、用得上、说得清”。
让智能体更可信的Jeddak AgentArmor 技术挑战与落地实践
LLM Agent广泛应用于商业办公等多领域,但面临严重信任挑战,如输入端易受恶意信息渗透、规划端理解指令不充分、行动端存在过高权限访问风险、输出端易泄漏敏感信息。我们打造“行为零信任”的运行时信任加固能力AgentArmor,让可信智能体具备抵御攻击、行为无害、可靠精准三大特性,缓解智能体Security、Safety、Functionality三类风险。
AgentArmor对安全威胁的识别率达93%,相较于传统方案,在安全与效用两方面展现明显相对优势,并输出在智能体平台、MCP市场、GUI Agent等领域的典型落地案例。
演讲提纲:
一、业务背景阐述
1. 智能体技术发展趋势
2. 智能体面临的信任挑战
3. 三大可信风险具体表现
二、方案选型:AgentArmor可信智能体方案
1. 核心目标设定
2. 技术路线选择
3. 产品集成优势
三、落地挑战分析
1. 技术层面
2. 业务层面
四、解决思路与实践
1. 核心功能落地
2. 典型应用案例解决
3. 性能优化举措
五、未来规划
听众收益点:
1. 听众可掌握LLM Agent发展与应用,明晰其三大可信风险及危害,建立领域风险认知;
2. 能理解AgentArmor核心功能与技术路线,明确其防护性能优势,掌握可信防护方案;
3. 可获取AgentArmor落地经验,了解纵深防御逻辑,明晰智能体防护趋势。
构建下一代Agentic AI应用的技术实践
大模型不再稀缺,真正稀缺的是能落地、可控的 Agentic AI 应用。本演讲介绍如何在 AWS 上结合 Kiro、AgentCore 与 QuickSuite,构建智能体编排与工具调用底座。针对“幻觉放大”“Agent 失控”“数据隔离”等难题,我们将拆解架构选型与治理机制,并预览 re:Invent 2026 新服务如何提升调试效率,助力团队把 Agent 从 Demo 推向规模化生产系统。
演讲提纲:
- 行业背景与趋势:
- 业务痛点与失败模式:为什么很多 Agent 项目止步 PoC
- 技术方案选型:AWS + Kiro + AgentCore + QuickSuite 的角色分工
- 落地挑战拆解:从 Demo 到生产的关键拐点
- 解决思路与架构实践
- 客户案例:从问题到成效的闭环
- 总结
落地挑战和方案重点:
- 为何Agentic AI相关的项目大都止于PoC阶段,目前Agentic AI的项目都遇到了哪些困难
- AWS如何利用自身服务,帮助开发者度过这些难关
- AWS服务过的客户是怎么做的
阿里云百炼Agent平台与智能体开源框架AgentScope
在大模型快速发展的推动下,智能体能够将内在知识与外部工具运用相结合,从而极大地增强了其处理复杂任务的能力。顺应这一发展趋势,阿里云百炼Agent平台以及开源框架AgentScope,全面支持灵活高效的智能体-环境交互,以构建丰富的智能体应用。具体而言,我们抽象了智能体应用所必需的基础组件,包括记忆、工具等,并提供统一的接口和可扩展模块,使开发人员能够轻松利用最新进展。
在此基础上,我们集成了多个针对特定实际场景定制的内置智能体,开箱即用,轻松扩展领域知识,快速适配多样化业务场景;通过自我进化机制,实现知识积累与技能提升。此外,百炼Agent平台及AgentScope还提供强大的系统支持,包括基于动态能力扩展与可视化开发,支撑智能体开发全流程;以生产级运行时和多语言支持,构建从开发到部署的可靠闭环。这些功能为构建可扩展、自适应且高效的智能体应用提供了切实可行的基础,真正让智能体从原型走向落地。
全栈开源 AgenticOS 的创业实践
LemonAI 是全球首款全栈开源的 AI Agent,Github上排名前列的一款可以本地完整部署,具有 VM Sandbox 的全栈开源的多智能体 Multi-Agent 的 Agentic OS,基于 Agentic-Memeory 实现 AI Agent 的 Self-Evolving 能力,并线上 AgentStore 共享社区 Experience,让 Agent 越用越好。此次演讲将基于 LemonAI 的过去9个月的实际开发经验和 knowhow,跟大家分享 AgenticOS 的实战经验,方便大家在未来能够与自己的业务和行业结合,实现 Agentic 时代的转变。
演讲提纲:
1、AgenticOS 的基本概念
2、AgenticOS 的行业现状
3、AgenticOS 的应用场景
4、AgenticOS 的未来思考
听众收益:
了解 AI Agentic 的核心理念和认知,突破现有对AI行业技术和发展的瓶颈认知,获得下一代AI最前沿的理念,经过实战思考未来趋势。
小米 GUI Agent 的思考和实践
在人工智能与移动终端深度融合的浪潮中,如何让智能体真正“看懂”界面、“自主”操作,已成为人机交互领域的关键挑战。小米 GUI Agent,作为基于视觉语言模型的图形界面智能体,通过端到端的感知与决策能力,实现了对手机、汽车等多场景的跨平台精准交互,无需依赖传统结构化数据,极大拓展了智能助理的应用边界。
在2025年10月的 SuperCLUE 测评中,小米 GUI Agent 以90.01分的优异成绩斩获金牌,在13款国内外竞品中位列第一,标志着手机交互正从语音助手时代迈入 GUI 智能体驱动的新阶段。
本次演讲将系统介绍我们在 GUI Agent 方面的技术思考、核心模型架构、强化学习优化策略,以及在手机与汽车座舱等场景中的规模化落地实践,并展望其未来的演进方向与应用前景。
演讲提纲:
1、GUI Agent 概述:从自动化工具到感知决策智能体
2、核心技术架构:视觉语言模型与强化学习的深度融合
3、系统能力评测与实际场景表现
4、落地实践:从手机到跨设备场景的规模化部署
5、未来展望:GUI Agent 的技术演进与生态构建
听众收益:
- GUI Agent 的基础认知
- GUI Agent 小米的前沿研究
- GUI Agent 小米的落地实践经验
客服领域Agent模型的内外兼修之道
在阿里云客服业务中,我们面临着大量中频、长尾的复杂工单,传统定制化 Workflow 的方案难以规模化覆盖。为应对这一挑战,我们摒弃了单点定制的思路,转而构建一个可长期规模化的通用型 Agent 系统。我们的核心理念是「内外兼修」:对模型外,通过自研的在线阅读器和上下文管理器,将冗长、嘈杂的工单信息提炼为高质量的输入,解决“垃圾进,垃圾出”的源头问题;对模型内,我们设计了一套高质量训练数据构建的 Pipeline,并结合强化学习,高效地将模型的行为与人类专家的行为对齐。
演讲提纲:
- 业务背景与挑战:为何需要通用自助型Agent
- 模型之「外」:构建高质量的信息环境
- 模型之「内」:SFT与RL的双重修炼
- 总结与Takeaway
听众收益:
- 掌握构建复杂任务 Agent 的系统性方法论,解决长上下文、高噪声场景的工程经验;
- 了解如何基于高噪声的专家轨迹,构建可用于模型训练的高质量数据。
面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进
个人数字记忆碎片化是终端Agent面临的核心挑战。本次演讲分享OPPO如何构建一个面向手机Agent的记忆系统,以解决“记不起、找不到”的用户痛点。我们将深入探讨这一系统的三大核心支柱:
1. 记忆机制设计:如何为手机Agent设计端云融合的分层记忆机制,实现从瞬时感知到长期记忆的协同运作。
2. 知识增强策略:为何我们选择Agentic-RAG作为主架构,并巧妙融合轻量微调,以在成本、时效性和隐私间取得最佳平衡。
3. 上下文管理与成本优化:如何通过动态上下文压缩与窗口管理策略,在保证95%问题准确性的同时,将端侧响应时延压缩到极致。
我将以已商用OPPO手机AI搜索为例,分享在召准F1=83.9% 的背后,我们在模型选型、工程架构上的权衡、痛点与前沿思考。
演讲提纲:
一、引言:手机作为个人数字记忆体——Agent记忆工程的机遇与挑战
二、核心架构:面向手机Agent的记忆系统设计
三、实战:高精度、低时延记忆检索的工程实现
四、未来演进:更智能、更经济的Agent记忆
听众收益:
1. 获得一套经过大规模用户验证的、端云融合的Agent记忆机制设计蓝图。
2. 深入理解“RAG vs. 微调”在终端场景下的决策权衡与混合实践,而仅是理论对比。
3. 掌握一套可落地的上下文压缩与窗口管理策略,直接用于解决长上下文带来的成本与延迟问题。
4. 学习如何将大模型的智能与确定性工程逻辑结合,构建稳定、可靠的商用AI产品。
盛大游戏开源记忆系统EverMemOS的技术解读
从工具到伙伴:OPPO AI智能体技术探索与实践
AI智能体早已在手机里展现潜力,相关技术已深入手机操作流程,成为用户日常生活工作的工具,并继续走向真正懂得用户的伙伴。
本次演讲将系统介绍我们在AI智能体方面的技术思考、智能体设计与优化策略,以及在小布助手中的落地实践,并展望其在手机设备上未来的演进方向与应用前景。
演讲提纲:
1. 手机智能体背景介绍
2. API智能体与GUI智能体
3. 个性化智能体应用
4. 应用难点与未来展望
听众收益:
1. 终端设备视角的AI智能体思考
2. OPPO在关键技术上的探索
3. AI智能体在手机上应用实践
“云小二Aivis”的架构实践:基于上下文工程与多智能体的自主服务新形态
“云小二Aivis”是阿里云客户服务领域的AI数字员工,它标志着我们从传统的智能辅助客服,迈向了更端到端Multi-Agent的数字员工能力的全新阶段。云小二Aivis核心是基于LLM的思考推理能力,在Multi-Agent和上下文工程的技术架构下,结合各类MCP Tool、Browser Use、Computer Use等工具调用能力,可以让数字员工能更像人一样去思考和解决问题。
这其实是一个非常有挑战的课题,这背后涉及到算法、工程、数据等多个维度的攻坚,本演讲将会从上下文工程和Multi-Agent技术出发,讲述“云小二Aivis”的实现落地过程,给ToB领域企业级Agent的开发提供许多借鉴思路。
演讲提纲:
1. 阿里云客户服务领域的业务痛点和挑战
2. “云小二Aivis”的多智能体架构设计
3. 基于上下文工程对“云小二Aivis”的调优经验
4. “云小二Aivis”的实际落地效果展示
听众收益:
1. “云小二Aivis”的多智能体架构设计
2. “云小二Aivis”的上下文工程实践经验
3. ToB领域的企业级Agent调优方法论
重塑办公数字员工:AI Agents 在 WPS 协作场景中的创新与实践
在新一代数字办公场景中,我们希望让 AI 不再只是“问答助手”,而是真正参与团队协作的数字员工。基于 WPS 的业务特性,我们构建了 hierarchical reACT + CodeACT + DeepAgents 编排器 的智能体体系,使其可在文档创作、项目协作、数据分析等多场景中完成端到端任务。
落地过程中面临三个核心挑战:多智能体协作效率、上下文成本与 365 工具生态的深度接入。为此,我们在 365 体系内实现工具化打通,引入 MCP 融合与子 Agent 裁剪,并通过 tag-cache 记忆压缩与 KV-cache 加速 将复杂任务时延大幅度降低。
同时,通过 fc & prompt 双模式适配 SaaS 与私有化场景,并构建类适配 365 体系的多轮测评体系,使任务成功率在关键协作场景提升 30%+。本次分享将聚焦上述方案背后的工程实践与机制设计思考。
演讲提纲:
一、业务背景:数字员工的演进与 WPS 场景需求
从“问答助手”到真正可协作的数字员工
WPS365 的典型业务场景:团队协作、深度创作、项目管理
为什么需要 Agent:任务复杂度提升、多工具链协同、跨文档跨成员协作
二、方案选型:面向办公场景的智能体体系设计
1. 总体架构:hierarchical reACT + CodeACT + DeepAgents Orchestrator
2. 层次化智能体:任务分解、角色协作、稳定性
3. CodeACT 在 Excel-Agent 中的落地与结构化推理
4. 编排器 DeepAgents:多 Agent 并行、冲突消解、工具调度
5. “面向 Agentic Era 的 Wide & Deep” 思路:广覆盖 + 深链路
三、落地挑战:真实业务中的复杂性
1. 跨产品线的 365 生态工具化打通
2. 多 Agent 同时处理复杂文档任务的 上下文压力与成本问题
3. 工具调用链长导致的 时延与成功率不稳定
4. 协作场景中 子 Agent 裁剪与群聊排序 的难题
5. SaaS vs 私有化:双模式下模型能力与资源差异
四、解决思路:工程化能力与机制设计
1. 工具化融合体系: MCP 内部整合、工具语义统一、自动容错
2. 上下文工程:
• tag-cache 记忆压缩与裁剪
• KV-cache 精准命中与推理加速
3. fc & prompt 双模式优化:
• 业务特性自适应
• 多工具调用链修复(sglang 方案已被官方 merge)
4. 测评体系构建:
• 类 BFCL-V3 的多轮测评
• 工具、任务链、多 Agent 的综合评估
• 关键场景成功率提升 30%+
五、未来规划:从单任务到真正的团队级 Agent 协作
1. 更细粒度的 Agent 能力拆分与调度
2. 统一的团队协作协议(Multi-Agent Collaboration Protocol)
3. WPS 内部大模型与 Agent 的深度融合
4. 更强的跨文档、跨成员、跨工具的自主规划能力
六、总结:迈向下一代办公智能体体系
1. 办公领域的 Agent 化是不可逆趋势
2. WPS 的探索基于真实场景、强工程能力和机制创新
3. 从“模型能力”迈向“系统能力”,打造真正的数字员工
听众收益:
1. 系统理解“办公场景中的 Agent 化”如何真正落地
了解 WPS 在团队协作、项目管理、数据分析等业务中的真实痛点与需求,以及如何为这些场景选型 hierarchical reACT、CodeACT、DeepAgents 等体系化方案。
2. 掌握复杂业务中部署多智能体系统的工程方法论
包括工具化打通、上下文压缩与加速、子 Agent 裁剪、工具调度策略等可复用经验,可直接帮助企业推进自身的 Agent 落地项目。
3. 获得可迁移的机制设计与评估体系经验
如 fc & prompt 双模式适配、任务成功率提升策略、类 BFCL-V3 的多轮测评框架等,可用于提升自身产品的智能体稳定性与业务效果。
智驱未来:以 Agent 为北极星的科技演进与投资新范式
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
智能体原生的学习框架Agent Lightning从设计到落地实践
杨玉庆博士现任微软亚洲研究院首席研发经理,负责领导上海系统组,专注于大模型系统与智能体系统的研究工作。他的研究兴趣包括大规模语言模型的高效计算与推理,尤其关注长上下文模型的推理加速;以及智能体的系统设计与优化,包括面向智能体的系统调度优化、多轮强化学习系统与算法等。他的相关研究成果已多次发表在OSDI、SOSP、EuroSys、ATC、CVPR、ICCV、NeurIPS等国际顶级学术会议上。杨玉庆博士于2006年和2011年分别获得复旦大学学士与博士学位。
DeepAnalyze:大模型到数据科学家的 Agentic 进化之路
于中国科学院计算技术研究所获得博士学位。他的研究方向涵盖大语言模型、多模态大模型、AI for Data Science。相关研究成果在 NeurIPS、ACL、ICLR 等国际人工智能与自然语言处理会议发表论文30余篇,开源的多语言大模型、多模态大模型、数据科学大模型在 GitHub 社区累计获得7000+星标。他长期担任 CCF-A 类国际会议 ACL ARR 的领域主席和责任编辑。个人主页:zhangshaolei1998@github.io。
打造沉浸式的 Vibe Analyzing 体验——AI 驱动的数据分析新交互
AskTable 创始人,前阿里云 PolarDB 创始人之一。前火山引擎数据库产品负责人。
从对话到洞察:Agentic NL2SQL驱动的智能数据分析引擎
AI Agent在快手生活服务数据中心的探索及应用
10年+的数据仓库从业经历,先后就职于京东、阿里、快手,在数据仓库建设、数据仓库治理方面积累了丰富经验,热衷于探索AI在数据仓库中的应用。
从代码大模型到通用代码智能体
北航卓越青年学者,主要研究领域涵盖自然语言理解与生成、大模型预训练与微调、代码智能、代码安全等。在ICLR、NeurIPS、ICML、ACL、EMNLP、NAACL、AAAI、IJCAI等发表论文和报告论文百余篇,其中第一作者/通讯作者20余篇,谷歌学术引用14000+次,并担任NeurIPS、ARR (ACL、EMNLP、NAACL)、AAAI-AIA等国际会议的领域主席(Area Chair,AC)和高级程序委员会委员(Senior Program Committee,SPC),以及期刊Electronics特刊客座编辑。
博士期间作为北京航空航天大学与微软亚洲研究院联合培养博士生代表微软参与世界超大规模多语言机器翻译(WMT2021)三项赛道比赛第一,毕业后在阿里巴巴任职期间(入选阿里星计划),作为通义千问(Qwen)及通义千问代码大模型的QwenCoder系列的核心贡献者,参与千问模型代码能力建设及专项千问代码大模型系列研发(已成为学术界常用基线模型,github数千星)。此外,作为国内知名大模型开源组织M-A-P的主要贡献者,开源若干大模型基座模型,包括全开源代码大模型OpenCoder等。
通义多模态、多端 GUI 智能体 Mobile-Agent 实践
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
OxyGent:构建高效能多智能体系统的协作框架
中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注AI技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。
构建专业级智能体:从开发工具到产业实践的技术闭环
缪旭博士,九章云极DataCanvas公司AI首席科学家,是人工智能领域的杰出布道师。
毕业于华盛顿大学,拥有超过二十年的AI研究与管理经验,长期深耕于AI技术的实现与应用,特别是在AI人机交互方式的探索与落地方面,取得了卓越成就。
学术造诣深厚,在ACM SIG KDD、IJCAI、IJCV、NeurIPS及Neural Computation等国际顶级期刊与会议上,发表多篇具有影响力的学术论文,并拥有授权美国发明专利10余项。不仅展现其在AI领域的深厚底蕴和卓越创新精神,更为AI技术的发展和应用提供了有力支撑。
曾在微软研究院和LinkedIn等国际知名企业担任研究员等重要职务,曾成功创办Astound.ai、Reasoned.ai等多家高科技公司,专注于将可推理可解释的人工智能、大模型、大规模实时机器学习、情感计算等前沿AI技术加速应用于各行各业,推动AI技术的商业化进程。
于2023年入选国家启明计划,目前作为九章云极DataCanvas的AI首席科学家,继续引领公司在AI技术的研发与应用方面不断突破,为推动AI技术的创新与发展贡献力量。
AI编程中的轻量级智能实践
深耕K8s容器、微服务架构多年,现专注AI原生应用技术,探索大模型与工程实践的创新结合。目前主导 Qoder CLI 产品研发,致力于提升开发者体验与生产力,为AI时代打造高效基础设施。
构建可理解界面、可执行任务的智能体:移动端 GUI Agent 技术拆解
2022 年加入去哪儿旅行,负责自动化测试、录制回放等工程提效工具建设,拥有丰富的复杂系统工程经验。自 2023 年起专注 AI 大模型应用,推动 AI 在测试与需求领域的规模化落地。曾获得去哪儿 AIGC Hackathon 冠军。现作为 AI 创新方向的负责人,主导基于视觉大模型的 GUI Agent 技术研发。
开源 Data Engineering Agent 的成长之路
赵恒,Datus.AI 的创始人,StarRocks TSC member。从阿里的数据库开发工程师到多个开源项目的连续创业者。
华中科技大学计算机本硕,毕业在阿里巴巴从事分布式数据库开发,后在数据领域持续创业,曾获得德迅等VC的投资,最终公司被收购。近5年作为创始团队成员负责了开源数据库StarRocks从0到1的产品设计,并专注于北美数据分析市场的开拓和研究。
评测驱动可信:蚂蚁数科金融级智能体评测体系落地实践
蚂蚁数科AI业务质量与质量效能负责人,负责蚂蚁数科AI业务整体质量及质量效能平台建设工作,主导构建智能体评测平台&蚂蚁数科质量平台,覆盖从算法验证到业务交付的全链路质量管控。10余年软件开发及测试经验,擅长测试工具开发、质量效能平台建设等方向有丰富的落地经验,曾任职网易、淘宝、腾讯音乐等公司,个人累计申请多篇专利、软著。
让智能体更可信的Jeddak AgentArmor 技术挑战与落地实践
刘洋 博士,现任字节跳动技术专家,专注人工智能安全与隐私方向,主导多项大模型/智能体安全、联邦学习等项目的研发与落地,拥有NeurIPS、IJCAI、 IEEE/ACM ToN等20余项学术论文,以及40余项人工智能安全、大规模隐私计算基础设施相关的发明专利。毕业于清华大学、澳大利亚国立大学。
构建下一代Agentic AI应用的技术实践
超过7年协助跨国及本土大企业数字化转型,6年支持创业及中小公司客户实现高速增长。对网络,容器,微服务,机器学习方面有深层见解和研究。目前带领技术团队专注在利用生成式AI帮助创业及中小企业公司完成更多云原生创新项目的落地。
阿里云百炼Agent平台与智能体开源框架AgentScope
全栈开源 AgenticOS 的创业实践
清华大学经管学院 MBA,西安电子科技大学计算机系本科。2014 年创办宜创科技,目前已服务国内上百家大型技术团队和项目。宜创科技 2023 年开始专注在基于大模型 AGI 领域创新,已推出 ChatBI、ChatExcel、ChatPDF 等多个产品。目前,宜创科技正在构建全新的大模型中间层基 LLMFarm,个人智能助理 FriAI ,致力于帮助企业解决不能用、不会用、不好用的大模型开发的实际痛点,让中国企业都能以十分之一成本,利用 LLM 大模型落地各行业应用场景。
小米 GUI Agent 的思考和实践
北京大学心理与认知科学学院硕士行业导师,北邮101拔尖班企业导师,CCF YOSCEF总部学术委员,CCF大模型论坛执委,微软小冰初创成员。研究方向:人机对话、大语言模型和AI Agent。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,主导了小米MiLM系列基座模型训练。曾获23年小米百万美金技术大奖,24年CCF计算机应用创新技术一等奖,24年数博会优秀科技成果奖等,在国际顶级学术会议和杂志发表论文30余篇。
客服领域Agent模型的内外兼修之道
在阿里主要负责客服Agent系统及其领域模型训练相关算法。前腾讯AILab算法,中国科学院数学与系统科学研究院博士。
面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进
之前曾参与百度小度音箱项目的开发上线工作,加入OPPO后负责过OPPO视频字幕业务上线及优化实施,目前负责OPPO AI搜索业务落地上线及优化工作。
盛大游戏开源记忆系统EverMemOS的技术解读
从工具到伙伴:OPPO AI智能体技术探索与实践
OPPO AI中心技术专家,从事智能体大模型与AI智能体的探索与应用工作。本科毕业于中国科学技术大学,博士就读于中科院大学。研究兴趣包括推荐系统、大模型与AI智能体等,相关研究成果在ACL、ICLR、AAMAS、WWW等国际会议发表论文10余篇,曾获得KDDCUP 2021第四名,ICLR2025 Spotlight等。开源的轻量化大模型 Hammer 系列已集成到谷歌 AI EDGE SDK,在 Huggingface 社区累计下载量达到10W+。
“云小二Aivis”的架构实践:基于上下文工程与多智能体的自主服务新形态
阿里云智能技术服务平台部智能技术组算法专家,负责阿里云服务领域Agent平台、多智能体协同等AI大模型技术在客户服务领域的落地。在阿里云服务领域深耕多年,曾负责服务领域大模型的训练调优、对话机器人链路体系的构建,逐步建设起了阿里云服务领域的算法技术体系和各类基础设施,主导构建了阿里云服务领域大模型、服务领域Agent/Multi-Agent技术、知识库问答、知识图谱、推荐系统等。
曾获得阿里云智能集团凌云奖、阿里云天池大数据算法竞赛冠军;曾以第一发明人发表发明专利6项;多次在阿里云开发者公众号发表AI技术文章,累计阅读量破10w+。
重塑办公数字员工:AI Agents 在 WPS 协作场景中的创新与实践
现任金山办公高级算法经理,负责智能体技术在 WPS 的落地。曾就职网易新闻与美团外卖,从事搜索、NLP、广告机制与推荐算法研发。现聚焦多智能体协作、推理奖励塑形与商业机制设计研究。