使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2 天沉浸式学习交流 | 15+前沿分论坛 | 60+真实应用案例
2026年3月,Agent技术正在以惊人的速度进化。OpenClaw发布了最新版本。
作为全球首个面向消费者的AI Agent平台,OpenClaw实现了真正的自主任务执行——不仅能理解复杂指令,还能跨应用协作、自动规划多步骤流程、实时学习用户偏好。行业评论称:"OpenClaw让AI从'工具'变成了'同事'。"与此同时,MCP协议正在成为行业标准。2026年初,Anthropic、OpenAI、Google相继宣布全面支持MCP。工具调用不再是"各自为战",而是有了一个统一的"连接语言"。
2026年,是Agent从概念走向大规模落地的元年,Agent将在金融、制造、零售...行业应用密集爆发。
举办地点为什么选在深圳?深圳是中国科技创新的最前线,硬件生态上,深圳是全球最完整的电子产业链,端侧Agent最先落地。与此同时,深圳拥有最活跃的技术氛围、技术最先传播的开发者社区。在产业落地方面,腾讯、华为、字节、比亚迪...大厂聚集深圳,基于这些天然优势,我们要在深圳举办Agentic AI Summit会议,让深圳成为Agent技术交流的中心。
胡云华,西安交通大学和微软亚洲研究院联合培养博士,先后担任微软亚洲研究院副研究员、阿里巴巴达摩院资深算法专家、支付宝中国首席数据官、智谱华章副总裁,在搜索、广告、推荐、大模型研发、用户产品创新方面拥有丰富经验。
13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。
具有多年在传统数据库管理和大数据分布式平台开发与维护的专业背景。熟练掌握大数据技术,能够高效地进行批处理和流处理任务的设计和实施。对数据湖架构的构建和优化也有深入研究,能够帮助企业从海量数据中提取有价值的信息,支持数据驱动的决策制定。
目前在eBay作为数据平台研发总监,带领团队负责云原生的数据湖,分布式搜索引擎,调度系统,存算分离计算引擎,OLAP离线数据库,数据开发平台等技术的实施,优化,开发工作。
石建平先生曾任美国甲骨文全球产品研发负责人、A8音乐CTO,联合创办多米音乐并发展为独角兽企业,投资了PPIO、即时设计等多家高速成长的早期技术公司。
美的集团首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow IET Fellow ACM Distinguished Scientist。
吴友政博士,京东科技集团语音语义算法部负责人、高级总监。博士毕业于中国科学院自动化研究所,毕业后在日本情报通信研究机构、英国爱丁堡大学、索尼中国研究院和爱奇艺负责自然语言处理、语音识别、机器翻译等前沿技术研究和产品研发工作,在国际自然语言处理顶会和期刊(如ACL、NAACL、EMNLP、AAAI、ICASSP等)上发表多篇学术论文。曾获得语音识别(IWSLT2012、IWSLT2013)和对话式机器阅读理解(QuAC 2020)比赛的冠军。连续2年主办京东人机对话挑战赛。技术产品化上,带领团队打造了基于多轮对话技术的智能客服平台言犀、基于多模态内容生成技术的品创等产品。曾获得京东集团技术金牛奖等荣誉。
企业架构和数字化转型专家,北京大学理学硕士,银行、保险、车企20年工作经验,《企业架构驱动数字化转型》作者,“金融IT那些事儿”公众号主理人。
AI数据生产(标注、数据集、合成)、AI安全(评测、防御)、AI软硬件一体、AI营销相关领域从业者。
企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。
阅文集团技术副总经理,AIGC负责人,腾讯云最具价值专家、复旦大学计算机学院专业硕士导师。有着近15年的人工智能、大数据研发管理经验。在AIGC、个性化推荐、搜索、大数据挖掘、自然语言处理等领域都有丰富的实践经验。目前主导人工智能技术在集团内部的研发和应用落地,带领团队研发了阅文妙笔大模型和多模态大模型,并在作家辅助创作、角色对话、增长素材和机器翻译等大模型应用场景上也取得了不错的成果。对内容业务有深刻理解,也主导推进智能风控、推荐系统、反盗版等公司重点项目落地。曾任百度人工智能事业部技术经理,负责过百度推荐、精准广告、图片搜索、大数据商业化等项目。
Foundation Model 2.0 | 企业级Agent开发工具链 | Agent 记忆工程 |
|
|
|
自进化Agent | Harness Engineering(Agent执行与控制工程) | 多Agent协作 |
|
|
|
面向Agent数据架构 | 面向Agent的知识与本体语义构建 | Agent评测与安全治理 |
|
|
|
前沿探索与超级Agent | 从DataAgent到Data Engineer Agent | 研发效能Agent |
|
|
|
工业场景Agent实践 | 金融场景Agent实践 | 消费场景Agent实践 |
|
|
|
10 多年 AI 研发与应用经验,主导研发大模型训推一体平台。完成金山办公政务大模型在 GPU 和国产 XPU 两个平台的从头预训练。联合华中科技大学先后发布并开源 Monkey,TextMonkey,MonkeyOCR 等一些列多模态大模型。几十项 AI 发明专利,多篇 AI 相关论文,主导多个 WPS AI 功能的自研和上线。
腾讯数据计算平台部,大数据智能体算法负责人,博士毕业于浙江大学,研究方向为大模型智能体。 在 ICML/NeurIPS/AAAI/ACL/VIS 等人工智能和可视化领域国际顶级期刊会议上发表多篇论文。主导研发腾讯一站式大数据智能体开发平台 LangData。
华为数字化高级技术专家。拥有 15 年深耕企业数智化转型的深厚积淀,职业历程覆盖中石油、SAP等跨行业头部企业,在AI、大数据、数据底座构建及云原生技术领域具备全栈技术能力。曾作为 AI 应用首席架构师,主导推动AI大模型技术在华为云研发体系、全球营销服务网络及智能资产运营等关键业务场景的深度应用,通过技术创新实现业务流程智能化重构,持续为业务增长注入技术动能,显著提升运营效率与服务质量。
毕业后先后就职于两家美企,从事高性能计算和互联网后端研发工作。2007 年开始合伙创业,并任职 CTO,拥有 11 年的社交 App 创业和并购经验。之后于 2018年加入晓黑板,担任 CTO。热爱开源技术,拥有 20+ 年的开发、微服务架构经验以及十多年的技术团队管理经验。在微服务架构、分布式系统、机器学习模型上有深入研究。还是持续学习者,主张系统和架构尽可能保持简单,工具大于文档和约定的理念。
南京理工大学与美国伊利诺伊大学香槟分校(UIUC)联合培养博士,现为腾讯 TEG Agent基础设施平台架构负责人。拥有超过10年大数据和AI系统研发经验,在AAAI和ACM等多个顶级会议和期刊上发表论文10余篇,申请发明专利10余项,主要研究兴趣包括分布式计算、机器学习、联邦学习、可信隐私计算和AI基础设施。
任职于腾讯的工作经历与项目职责:
- Agent基础设施平台架构负责人 (当前职责):负责腾讯 TEG Agent基础设施平台的架构设计,主导构建了包括安全沙箱环境、Agent全链路追踪(Tracing)与评估体系、多智能体编排与调度系统在内的核心基础设施,为上层AI应用提供安全、可靠、可观测的智能体运行与治理能力。
- 数据科学引擎负责人:负责Wedata数据科学引擎的整体搭建与演进,并主导设计面向大模型训练与应用的高效数据管道,解决了海量多模态数据预处理、质量管控与供给的工程挑战,为AI模型研发提供坚实的数据基础。
- PowerFL隐私计算平台负责人:负责平台整体系统整体架构设计,主导并实现了PowerFL核心库SDK、联邦调度引擎、联邦推理引擎、云原生轻量级私有部署及国产化方案的设计与开发。持续提升框架的易用性、算法的安全性与性能,成功赋能腾讯云、AMS、微信支付等在金融、政务、推荐及广告等领域的隐私计算业务落地。
负责领导知鸟的技术产品创新与落地,打造了覆盖“学、练、问、考、管”五大培训场景的AI产品矩阵,构建知鸟的AI核心竞争力,推动AI技术在人才培养领域全面应用与深化。深耕于AI+SaaS领域10多年,在ToB行业的AI应用上有着丰富的产品研发和落地经验,曾发布过营销行业领域大模型MeetGPT,教育行业AI+SaaS的多模态一站式智慧课堂产品溢慧云等。历任飞书深诺集团CTO、溢米教育集团合伙人&CTO、爱奇艺技术总监等。
2009年毕业于武汉大学软件工程专业,入职深信服至今,曾担任技术专家、架构师、运营负责人、研发主管等岗位,熟悉AI深度学习、大数据、安全、云计算、终端等领域,拥有专利10余篇,当前对内负责AI驱动公司研发全过程提效,对外负责CoStrict产品(一款面向企业严肃开发的开源AI编程工具)。
目前担任顺丰科技 AI 技术平台负责人,负责顺丰集团 AI 和大模型基础架构,曾任第四范式平台架构师和 OpenMLDB 项目 PMC,过去在小米担任云深度学习平台架构师以及优思德云计算公司存储和容器团队负责人。活跃于分布式系统、机器学习相关的开源社区,也是 HBase、OpenStack、TensorFlow、TVM 等开源项目贡献者。
先后在百度、Bigo、Shopee 工作,拥有 10 余年 AI Infra 经验,专注大规模 AI 系统架构与性能优化,在模型训练、推理加速及端到端工程体系方面积累深厚。当前在 Shopee 负责大模型预训练、后训练和推理基础设施建设,参与大规模 GPU 集群架构设计与性能优化,持续提升资源利用率与系统稳定性,推动大模型在公司内的高效迭代与规模化落地。
现任vivo互联网大数据专家,拥有10年实践经验,专注于多模态数据技术相关的研发工作,对于海量数据场景下关于数据全链路稳定性保障、数据质量提升、数据成本优化等整体方案设计和落地有丰富经验,擅长从业务价值视角出发,提供有效的数智化解决方案。
2006 年毕业于西安交通大学自动化专业,现任 OPPO AI 架构负责人。曾主导多个大型手机操作系统项目的整体架构设计,在跨端操作系统与移动 AIOS 领域深耕多年,具备从底层系统到上层智能体验的全栈架构能力。当前聚焦于打造高效、懂你的 OPPO AIOS,致力于将 AI 能力系统级融入用户体验。
电子科技大学信息安全硕士,专注于人工智能与运筹优化技术在物流供应链领域的落地。
加入顺丰科技以来,先后负责集团智能决策体系与智慧供应链商业化产品体系的构建与管理工作。主导研发物流决策大模型"丰知"、智慧供应链控制塔"丰智云塔"及决策平台"丰智云策"等核心产品,服务数百个SKA客户,实现千万级营收。在运筹优化领域,构建大规模网络规划、路径规划、资源调度等核心算法体系,助力集团累计降本超十亿元。
曾获中国物流与采购联合会科技进步奖二等奖、物流技术创新奖、CCF BDCI最具商业价值奖等多项荣誉,产品入选Gartner SCP亚太榜单。
通义实验室文档智能技术负责人和 GUI 智能体 Mobile-Agent 负责人,主要研究方向多模态智能体、长文本理解和推理、文档智能解析和多模态文档创作等,负责打造文档智能模型产品 QwenLong、Qwen-Doc,以及文档智能解析产品 Document Mind,相关能力应用于千问APP、通义智文以及内外部多个产品线,并主导 Mobile-Agent 开源技术体系影响力建设(8k+ Stars)和创新产品孵化,在 ACL、ICML、ICLR、NeuIPS、CVPR 等国际会议期刊发表100多篇相关学术论文。
硕士毕业于华南理工大学计算机专业,中邮消费金融公司创始团队成员之一,曾任科技发展部总经理助理,资深架构师,曾负责公司两次IT系统规划的制定、整体架构设计和落地实施,成功主导大型金融系统从集中式到分布式、微服务的中台架构转型。现任产品创新部负责人,负责产品创新和研发、数智化转型、企业级业务架构设计等。目前已获得系统架构设计师、信息系统项目管理师等认证,华南理工大学电子与信息专业博士研究生。
长期深耕于大数据及人工智能领域,积累了丰富的数据平台建设和架构设计实践经验。现任阿里国际 AI Business 大模型数据、评估负责人,专注于大语言模型及多模态大模型数据研发、模型评估工作,致力于推动数据与AI技术的迭代融合与创新。重点攻坚大型模型对应的大规模、高质量数据处理技术及优化,大模型在业务领域表现的自动化评估技术。在此之前,曾担任阿里云行业大型模型数据研发负责人、阿里云政务及医疗行业数据负责人、蚂蚁金服国际数据平台架构师。
本科毕业于清华大学电子工程系,在美国宾夕法尼亚大学攻读程序语言专业博士,现任粤港澳大湾区数字经济研究院(IDEA研究院)基础软件中心首席科学家、MoonBit团队负责人。
曾任OCaml语言核心开发人员,其主导开发的ReScript语言(原BuckleScript)是首个由中国人主导的国际通用程序语言,官方文档支持多国语言版本。2013年受彭博社邀请开发函数式语言编译器,创建的BuckleScript项目后被Meta等公司采用。2017年回国后成为Meta中国大陆唯一软件工程师,维护BuckleScript并参与Flow语言开发。
2022年加入IDEA研究院创立基础软件中心,带领团队开发MoonBit编程语言及工具链,该语言基于WebAssembly设计,支持云计算与AI开发,已适配RISC-V指令集并进入北京大学、清华大学课程体系。OCaml语言项目获2023年SIGPLAN软件大奖。截至2025年,MoonBit用户已超过10万,预计2027年初达到近100万用户。
二十年研发和互联网行业经验,先后任职于金蝶、淘宝/天猫、OnePlus、超级猩猩等企业,一直从事和负责产品研发、数字化和智能硬件等相关岗位,对数字化、高性能计算、云平台、智能 IoT等领域有深入的积累和经验,并擅长于将技术融入商业场景和模式中。
清华大学智能技术与系统国家重点实验室信号与信息处理专业硕士,26年人工智能和大数据经验。现任平安科技算法平台部负责人,全面统筹智能体平台及模型训推平台从技术研发到体系化建设的全链条工作。曾获2020年度吴文俊人工智能科技进步一等奖、2022年度广东省科技进步一等奖、2022年度中国人民银行金融科技发展奖二等奖、2024年度中国人民银行金融科技发展奖二等奖等重要荣誉。
曾任职百度、搜狗、腾讯等知名企业,深耕AI算法、搜广推算法等领域。现任平安知鸟AI负责人,专注于AI技术在企业培训场景的落地与创新,助力企业在AI时代实现组织能力跃迁。
拥有丰富的NLP算法与大模型跨场景业务落地经验,专注于通过AI Agent技术提升业务效率。擅长将大模型与客服、私域、判责、舆情等场景融合,推动 AI 在实际业务中可控、可用、可落地。
深耕中间件与大数据研发15年,主导vivo公司级大数据平台BDSP从0到1落地,覆盖数仓、开发与分析全链路。近年专注AI大模型与数据平台融合创新,持续赋能业务,创造惊喜与价值。
瓴岳科技(洋钱罐)数据平台工具组负责人,拥有多年大数据领域相关工程化经验。主导设计并落地 DataPilot 一站式数据开发平台以及 AI Agentic 架构,深度参与基于 AgentScope 的生产级 Data Agent 集成实践。
清华大学毕业,高级算法研究员。研究方向涵盖信息检索、推荐系统与多模态内容理解。2019年加入腾讯,专注于用户增长场景的算法研发;近年研究重心聚焦生成式推荐(GenRec)、大模型推荐(LLM4Rec)与智能体推荐(Agent4Rec)等前沿方向。研究成果发表于 ICML、ACL、WWW、SIGIR、KDD、RecSys 等领域顶级会议,相关算法已在十亿级推荐场景中成功落地。
聚焦 AI Agent、数据基础设施与云原生计算平台方向,主导多项司内平台能力从 0 到 1 孵化与规模化落地,覆盖面向元宝等核心业务的安全沙箱、天穹 WeData Notebook 与 Compute 引擎、LLM Agent 开发平台及 LLM 可观测性平台;在大模型应用、云原生计算与智能系统方向有多项专利与顶会论文积累。
华为数字化高级技术专家。拥有 15 年深耕企业数智化转型的深厚积淀,职业历程覆盖中石油、SAP等跨行业头部企业,在AI、大数据、数据底座构建及云原生技术领域具备全栈技术能力。曾作为 AI 应用首席架构师,主导推动AI大模型技术在华为云研发体系、全球营销服务网络及智能资产运营等关键业务场景的深度应用,通过技术创新实现业务流程智能化重构,持续为业务增长注入技术动能,显著提升运营效率与服务质量。
研究方向涵盖 GUI Agent、多智能体框架与端云协同计算。近年在 NeurIPS,AAAI,WWW,CIKM,IEEE TC / TIFS 等会议与期刊发表多篇论文,参与 OPPO GUI 智能体系统研发与 Agent 业务应用上线。
西安交通大学博士,现任OPPO研究院高级算法工程师,在KDD、IEEE TKDE、ACL、IEEE TIP、 ECML PKDD等国际会议期刊发表多篇论文,现研究方向涵盖GUI Agent、多模态Agent、多智能体协同系统等。
资深IT团队管理者,拥有多年大数据、应用团队的技术架构规划与项目统筹管理经验。深耕大数据创新领域,斩获多项国内外创新类奖项,专业能力与行业成果备受认可。曾受邀担任 DataFun 线下特邀讲师,分享行业实战经验与管理架构心得。
一从事开发、架构设计、AI辅助研发效能提升能力构建。
负责大模型在多个场景中应用落地相关工作。在AI客服、AI邀约的大模型应用与全链路评测体系建设方面拥有丰富经验。致力于通过前沿AI技术解决实际业务问题,创造业务价值。同时深耕物流货运行业多年,曾就职顺丰科技,主要负责供应链解决方案算法及预测方案开发。
九年NLP和大模型相关业务经验,公司内做过多场大模型相关专题的分享。
中国人民银行金融标准制定委员会专家,互联网金融协会外聘专家,重庆数宜信信用管理公司高级顾问,重庆市人力资源开发服务中心认证AI应用讲师;15年商业银行高级管理经验,历任某互联网银行风险管理负责人,阿里巴巴和蚂蚁科技集团高级风险专家。熟悉线上信贷业务的风险模型、风险策略开发,熟悉大数据和人工智能技术基本原理及产业端的应用。
20 年金融科技一线,做过三套电子交易平台。
2019 年,作为项目经理与核心开发,交付平安证券"领航 (FLEET) 固收外汇电子做市交易系统",获深圳市金融创新奖一等奖。
2022 年,作为交易平台架构负责人,参与交付华泰证券"大象 FICC 多资产做市与风控平台",获人民银行金融科技发展奖一等奖。
现负责华泰"AI+AURORA 策略管理平台"——把 AI Agents 嵌进多资产策略的全生命周期。
先后承担中国移动数据仓库(经营分析)系统的规范设计、验收、运维,主持设计了中国移动规范符合度测试、POC选型测试等技术文档80余册、300多万字;带领团队构建新一代数智化运维体系,承接梧桐大数据6.4万+台节点规模,600+PB价值数据资产数智化运维工作;开展中国移动集团关键核心技术攻关,完成大数据架构去IOE,操作系统国产替代。荣获通信行业协会荣誉5项,移动集团级荣誉8项,多项信通院标准起草人。
就职微信实验平台,专注实验决策优化与因果分析Agent工程化落地。从 0 到 1 支持实验平台智能分析体系建设,推动 Notebook 证据链分析、实验报告自动化、CUPED 策略优化和 AgentOS 调度编排等能力落地,专注将复杂分析流程沉淀为可执行、可审计、可复用的平台系统。
中兴通讯应用软件资深专家、有线院MMVS产品AI提效负责人,中兴青年奖获得者。长期深耕通信软件研发与工程实践,专注AI驱动研发效能提升,积极推动Agentic AI在大型系统开发中落地。
深耕大模型与多模态方向近三年,专注视频智能体工程落地与时序感知记忆管理机制研究。参与了 OPPO 一键问屏与实景问答两款多模态 Agent 产品的研发,历史迭代产品分别在 2024、2025 年 OPPO 开发者大会正式亮相。拥有 7 年一线算法工程经验,长期负责从模型到系统的全链路交付。
数年高性能 OLAP 引擎研发经验,开源社区活跃贡献者;近来专注于面向 Agent 的向量数据库、Agent 可观测性等领域的探索与实践。
专注于分布式计算和存储,对Spark和PostgreSQL有深入研究,拥有多年StarRocks/Trino/link集群的运维经验,近两年专注于大语言模型在大数据方向上的智能应用。
长期专注于 Agent 在真实商业场景中的产业化落地,主要负责运满满的 Agentic 化架构设计与工程实践。当前重点探索长期运行 Agent、事件驱动感知、状态管理、高确定性执行与 Agent 工程体系建设等方向,推动 Agent 从 Demo 能力向 Production 系统演进。
技术背景:刘文志是中国高性能计算和 AI 领域的知名专家,中国科学院硕士,出版过《并行算法设计与优化》等四本技术著作。
工作经历:在创立足下科技前,他曾在英伟达、百度、商汤科技、华为等知名企业工作,负责过深度学习平台、异构计算团队以及智能汽车业务。
现任职务:目前他担任深圳市足下科技有限公司的董事长、总经理及法定代表人,同时也担任深圳市汽车电子行业协会的专家委员。
研究生毕业,10+年算法研发经验,CCF专业会员,参与语音识别评测T/ISC 0034-2023标准制定,负责过音频前后端处理,弱网优化,音视频质量提升,智能内容安全审核“T网”,内容理解“T悟”等大型项目,此前主要负责AIGC类算法研发,包括自研LLM领域大模型,语音大模型,图像生成等。曾作为“灵声讯”创始人,参与智能媒体技术自媒体运营和推广。
曾构建世界级流量架构,正建设第三代 AI 数据平台。
在大数据技术、算法工程、自然语言处理(NLP)和推荐系统等领域拥有深厚的专业积累,擅长通过结合大数据与智能化技术,搭建高效的 AI 智能应用。曾先后任职于腾讯、OPPO、字节跳动和美的集团等知名企业,在字节跳动与美的集团均担任核心技术负责人,主要负责大数据与智能化体系的建设工作。在职期间,参与了腾讯和 OPPO 内部的算法中台与大数据中台建设,此外还主导了抖音春节活动的用户反馈监控、抖音道具性能推荐项目,以及美的集团 AI 战略业务,积累了丰富的智能化产品开发经验。过往带领团队发表数十项专利,多次获得公司最佳技术团队称号,在技术创新与应用方面具备卓越能力。
长期从事企业数据平台、BI 分析和 AI Agent 应用建设,关注大模型在数据分析、可信问数、经营报告和企业知识沉淀中的落地实践。近期重点探索传音企业级 Data Agent 的能力规划与工程化路径。
Foundation Agents 社区核心成员,DeepWisdom Research Researcher,长期关注 LLM Agent 与多智能体协作发展,主导 Foundation Protocol 设计与落地。
现任小米高级算法工程师,长期深耕 Data+AI 领域。主导落地用户画像、智能分析、数据问答、Data Agent 等数据智能方案,2026 年 5 月 Bird 总榜第三。
拥有 6 年数据挖掘与用户增长经验,近 3 年聚焦 LLM 应用与 AI Agent 系统建设,先后主导贷后催收 Agent、理财通 AI 客服、金融营销合规审核等多个从 0 到 1 的 Agent 项目落地,覆盖对话式交互、Multi-Agent 编排、模型训练(SFT/RL/GRPO)及业务闭环全链路,具备从模型数据、大模型训练、SKILL、Agent 架构设计到评测的全栈 AI 工程能力。
获奖情况:
2025 AIIA 金融行业优秀AI案例《金融营销及基金宣推页智能合规审核》
2026 优秀金融科技案例《北京资管协会行业发展报告2026》
2024年度AIIA人工智能先锋案例《理财师敏感话术识别》
电子科技大学信息安全硕士,专注于人工智能与运筹优化技术在物流供应链领域的落地。
加入顺丰科技以来,先后负责集团智能决策体系与智慧供应链商业化产品体系的构建与管理工作。主导研发物流决策大模型"丰知"、智慧供应链控制塔"丰智云塔"及决策平台"丰智云策"等核心产品,服务数百个SKA客户,实现千万级营收。在运筹优化领域,构建大规模网络规划、路径规划、资源调度等核心算法体系,助力集团累计降本超十亿元。
曾获中国物流与采购联合会科技进步奖二等奖、物流技术创新奖、CCF BDCI最具商业价值奖等多项荣誉,产品入选Gartner SCP亚太榜单。
刘智勇是具身智能方向技术专家和科学家,机器人领域青年领导者之一,7年知名机器人公司首席技术官经历,阿里巴巴机器学习算法研究经历。苏黎世联邦理工学院计算机系全奖博士休学创业,曾担任苏黎世联邦理工学院计算机系研究助理,师从世界著名的机器学习教授,同时拥有工学硕士和工学学士学位,20+专利第一作者, 在国际顶级期刊和会议发表论文6篇。他的学术研究领域包括具身智能、机器人学习、移动机器人技术。他是文生行动推理智能体JI Agent的原作者,ZROS核心作者,国家奖学金获得者,清华大学启航奖获得者、最佳论文奖获得者,中国服务机器人及特种机器人产业联盟专家委员会委员。
2009年毕业于武汉大学软件工程专业,入职深信服至今,曾担任技术专家、架构师、运营负责人、研发主管等岗位,熟悉AI深度学习、大数据、安全、云计算、终端等领域,拥有专利10余篇,当前对内负责AI驱动公司研发全过程提效,对外负责CoStrict产品(一款面向企业严肃开发的开源AI编程工具)。
创邻科技图技术和图算法专家,在分布式图存储与图计算领域拥有近 10 年的研究与实践经验,曾主导并参与 LDBC 图基准测试标准制定。⽬前主要关注 Graph4AI 与 AI4Graph ⽅向,并在相关科研与落地实践⽅⾯拥有丰富的经验。参与编写图数据库相关书籍、⽩⽪书及⾏业标准,在 VLDB、ICDE 等数据库顶会上发表多篇⽂章,并荣获2025 VLDB 最佳论⽂提名奖。
香港城市大学数据科学博士,现任腾讯算法工程师。加入腾讯后主要参与狍子AI知识库Agent和Tomoro数据分析Agent开发,负责Agent上下文管理、知识检索与数据分析相关能力建设。
2015年毕业于东华理工大学。现任深圳价值网络科技有限公司(隶属华盛资本集团)技术副总监、部门技术负责人,拥有11年金融科技研发与架构经验和60+人团队管理经验,长期负责信贷、证券金融核心系统架构演进,覆盖交易、支付、清结算、金融中台、大前端治理与研发效能体系建设。近年专注AI工程化与研发效能变革,开源spec-first项目,推动从TDD向SDD升级,将AI Coding融入需求、编码、Review、部署和缺陷回流,相关实践已在技术中心范围使用。
毕业后先后就职于两家美企,从事高性能计算和互联网后端研发工作。2007 年开始合伙创业,并任职 CTO,拥有 11 年的社交 App 创业和并购经验。之后于 2018年加入晓黑板,担任 CTO。热爱开源技术,拥有 20+ 年的开发、微服务架构经验以及十多年的技术团队管理经验。在微服务架构、分布式系统、机器学习模型上有深入研究。还是持续学习者,主张系统和架构尽可能保持简单,工具大于文档和约定的理念。
计算机硕士,曾长期担任霍尼韦尔全球软件研发经理。从业十余年来,专注物联网技术、AI、大数据技术研发,具有丰富的大型研发团队管理经验。职业生涯历经移动互联网、工业物联、智能家居、智慧社区等多轮技术浪潮,主导 AI 算法、智能传感、物联平台等核心项目攻关,累计取得多项国内外专利、学术成果与软著,具备丰富的全球化项目交付与技术创新经验。现阶段聚焦 AI + Data 技术在智慧社区场景的落地变革,探索数智技术赋能行业发展的新路径。
10+年企业数智化经验,聚焦多端感知、跨端协同与智能体交互,致力于通过智能体实现“意图驱动服务”的下一代交互体验重构。
地瓜机器人生态软件工具负责人,具身机器人社区“古月居”生态合伙人,ROSCon China 机器人开发者大会联席负责人。专注于机器人操作系统及人工智能相关技 术的推广与应用,撰写了《ROS2智能机器人开发与实践》等畅销技术书,并参与负责组织 ROSCon China 机器人开发者大会。主导了OriginBot 等具身机器人产品系列的研发工作。曾获ROS布道师、NVIDIA 中国开发者最有价值专家等荣誉称号。
余锦泽,卡奥斯数据智能首席科学家、大规模个性化定制系统与技术全国重点实验室核心成员,东京大学博士。深耕工业视觉、数字孪生与具身智能,以第一/通讯作者发表顶会顶刊 29 篇、第一发明人授权专利 29 项,曾获日本机器人大奖、泰山产业领军人才。
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
中国社区首席布道师。新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过电脑设计,汽车电子,计算机操作系统,通信,云实时事件处理等。从爱立信开始,诺基亚,Ubuntu 到现在的 Elastic,从事社区工作有将近 20 年的经历。喜欢分享自己所学到的知识。坚信帮助别人就是帮助自己。希望和大家一起分享及学习。欢迎大家来参阅 Elastic 官方中文博客 elasticstack.blog.csdn.net
硕士毕业于哈尔滨工业大学(深圳)计算机科学与技术学院ICRC实验室,目前就职于阿里巴巴企业智能算法团队,主要从事多模态分类、智能文档方面工作。团队与通义实验室Qwen团队、智能引擎团队、东北大学IR实验室、清华大学NLP实验室合作,共同沉淀 UNIKIE-BENCH、MMM-BENCH、CC-OCR-V2 等多个智能文档抽取基准。
深耕电商与产业互联网数据科学与分析十多年,专注 AI 重构业务数据工作流&数据agent建设,主导品类经营 AI Agent 体系与 1688 AI 应用评测平台从0到1落地。熟悉B2B、近场电商、金融风险业务,完整经历了数据从"分析洞察"到"驱动决策"再到"AI自动化执行"的能力跃迁。始终坚信数据的价值不止于报表,更在于重构业务流程、让决策自动发生。
安克 AI 创新和应用演进之路
Agent 从“写代码”到“建系统”——技术演进、能力边界与可信工程的挑战
随着大模型与Agent框架的爆发,软件生成的成本正在趋近于零。真正限制 AI 编程落地的瓶颈,正在从“能不能写代码”转向“生成的代码是否正确、可验证、可维护”。
本次演讲将首先回顾Agent智能体在编程领域的技术演进:从代码补全、单文件生成,到当前的多文件修改、工具调用、自主调试,再到未来可能实现的规格驱动开发。在此基础上,重点分析Agent能力发展过程中被忽视的技术瓶颈——不是模型参数量不够大,而是缺乏对生成代码的可验证、可维护、可演化的工程约束。
最后,以IDEA研究院的MoonBit语言作为案例,简要展示一种“面向Agent的编程语言”如何通过语法设计、类型系统、形式化验证接口,让Agent从“写代码的助手”升级为“可信系统的共同构建者”。
演讲提纲:
一、Agent编程能力的真实水位
- 从Copilot到Devin、SWE-Agent:Agent能做什么,不能做什么
- 公开基准(SWE-bench等)的局限性与误导性
- 提出核心问题:为什么Agent写的代码在Demo里惊艳,在真实项目中翻车?
二、Agent技术演进路线:三代能力跃迁
1、第一代:代码补全 & 单函数生成(2021-2023)
- 技术特征:基于上下文填充,无规划能力
2、第二代:多文件编辑 & 工具使用(2023-2024)
- 技术特征:Agent+检索增强(RAG)+ 简单的错误反馈循环
- 代表工作:SWE-agent、OpenDevin、AutoCodeRover
3、第三代:规格约束下的自主构建(2024-现在)
- 技术特征:Agent读取形式化规格(spec)、生成证明、与验证工具协作
- 关键进展:自然语言→形式化规约的自动生成(GPT-4o、Claude 3.5等)
- 技术深度剖析:为什么类型系统、合约、前置/后置条件对Agent至关重要
三、当前技术的瓶颈:从“能写”到“可信”
1、实证数据:Agent生成的代码在Python/JS等动态语言中的长期维护问题
2、技术观察:
→ 验证成本远大于生成成本,这是被行业严重低估的瓶颈
→ Agent缺乏“反事实推理”:能写实现,不能写为什么实现是对的
→ 真实工程需要:可重现构建、跨环境兼容、团队可读性——这三项Agent几乎都做不到
3、行业探索方向:
- 基于强类型语言的Agent生成(Rust、Haskell)
- 引入轻量级形式化验证(Liquid Types、Refinement Types)
- AI 辅助生成规格(spec)与不变量(invariant)
四、案例:MoonBit如何尝试解决上述问题
1、MoonBit 的设计目标:面向AI生成+人工审核+自动化验证的编程语言
2、三个关键技术回应:
- 面向Agent友好的语法:减少歧义,减少LLM的token浪费,提高生成成功率
- 一等形式化验证(moon prove):让Agent可以生成前置/后置条件,自动验证
- 多后端与可重现构建:解决“在这里能跑,在别处不行”的Agent通病
3、初步数据:在内部SWE-AGI基准中,可验证代码的接受率提升2-3倍
五、总结与展望:Agentic Software Engineering 的未来
1、未来的Agent不是更大的语言模型,而是语言模型+验证器+类型系统+构建系统的紧耦合体
2、编程语言的角色从“给人写”转向“给人+Agent+机器验证器”三方协作
3、开放问题:规格的自动生成、验证的及时性、人机协同的交互范式
听众收益点:
1、重新理解 Agent 编程的核心瓶颈,听众将看到 Agent 落地的关键问题不是“模型会不会写代码”,而是生成代码如何在规格、测试、类型系统和形式化验证约束下进入真实工程。
2、获得一套 AI 原生软件工程的架构思路,通过 MoonBit 的语言设计、工具链、包管理、SWE-AGI 评测和 moon prove 验证实践,理解如何把 Agent 从“代码助手”升级为“软件构建参与者”。
3、了解可验证代码在 Agent 时代的实际价值,听众可以理解形式化验证为什么会因为 AI 而重新变得实用:AI 降低了写规格和证明的成本,而验证工具负责把“看起来对”推进到“性质上可检查”。
Data Agent设计实战:知识准备、库表检索与SQL- Python混合计算
数据团队日常面临三大痛点:找表依赖人工经验,元数据缺失率85%,一张报表准备需一两周;业务口径存在多重歧义,"上个月流水"在不同场景下含义不同,分析结果不可信;TB级数据本地pandas无法处理,需工程师改写为PySpark,周期长且存在数据安全风险。
我们的解法是基于通用Runtime协议(调度、记忆、工具契约)基础上,把"找/写/算"三件事的工具内核按数据场景重做:找表用四路信号(生产SQL+查询流水+Schema+业务背景)送LLM逆向推导语义,结合L1→L2→L3→L4渐进式披露让模型自主决策召回深度;写SQL用双赛道布局,免训练框架派Spider 2.0跑出60.15分(全球第5、免训练第2),训练派SiriusAI-Text2SQL-32B-v2冲到BIRD第4名;算用SQL-Python混合计算,海量数据SQL下推数仓,轻量结果回Python沙箱,整体计算性能提升10倍、成本降低6倍。
演讲提纲:
一、开场与业务背景
1.1 数据工作的标准流水线
1.2 三大核心痛点
1.3 为什么这件事必须现在做
二、方案选型:
2.1 Agent范式三代演进
2.2 为什么通用Agent不能直接干数据活
2.3 方案选型结论
三、知识准备:检索重构——让Agent"找得准"
3.1 问题定义
3.2 举措一:AI元数据增强(四路信号)
3.3 举措二:Profiling增强
3.4 举措三:渐进式披露检索(L1→L2→L3→L4)
3.5 行业SOTA对标
四、代码生成:模型增训——让Agent"写得对"
4.1 核心挑战:通用大模型缺乏业务语义
4.2 训练方式演进
4.3 两阶段训练 + 推理优化
4.4 双赛道布局(学术榜验证)
五、SQL-Python混合计算:计算重构——让Agent"算得动"
5.1 原架构的核心问题
5.2 新架构:SQL-Python混合计算
5.3 新引擎赋能现网
六、落地成效:学术+商业双轨验证
6.1 学术榜成绩
6.2 业务实测
七、未来规划
八、总结
听众收益:
1.掌握元数据缺失的系统性解法:学到如何用"四路信号"(生产SQL+查询流水+Schema+业务背景)送LLM逆向推导表语义,结合L1→L2→L3→L4渐进式披露检索架构,把找表Recall@5从41%提升到79%——这套方法可直接复用于任何元数据缺失的团队。
2.理解Text-to-SQL_accuracy天花板的破局路径:通过BIRD榜单人类92.96% vs Claude Opus 70%的鸿沟案例,理解通用LLM缺的是什么(企业私有业务语义),以及双赛道布局(免训练框架派+训练派)如何同时应对学术榜和商业落地两类场景。
3.获得TB级数据本地分析的工程解法:学会SQL-Python混合计算的具体实现——海量数据SQL下推数仓、轻量结果回Python沙箱。
基于AgentScope的金融数据平台Agentic进化之路
金融数据平台进入 Agentic 化深水区,挑战已不再是“能不能生成 SQL”,而是如何打通任务开发、数据探查、任务发布、数据质量、调度运维的全链路闭环。瓴岳科技基于 AgentScope Java 打造统一的生产级 Agentic 架构,围绕多 Agent 协同编排、平台能力接入、质量与安全治理、状态管理与可观测运维,沉淀可复用的工程化底座,实现从“需求理解-方案生成-发布执行-质量保障-运行处置”的平台级协同。分享将重点拆解从单点 AI 助手走向平台化 Agentic 系统的关键实践,帮助企业建立可治理、可扩展、可持续演进的数据平台智能能力。
演讲提纲:
1- 金融数据平台的全链路痛点:全球化部署复杂、协作链路长、准确度要求高、治理约束严
平台 Agentic 的质变:从单轮问答升级为“推理-工具调用-执行反馈-自动纠偏-持续记忆”的跨环节编排闭环
金融场景附加约束:高危操作拒答、权限门控前置、全链路可审计、跨 Agent 协同不越权,并在闭环中持续优化生成准确度
2- 方案选型
核心约束:严格单向依赖,禁止环依赖;扩展新业务场景以增量 Agent / 工具实现,不改编排内核。
AgentScope 在系统中的落点:仅收口在编排层适配包中,业务 Agent 不直接接触框架内部 API,为未来框架升级预留缓冲。
3- 落地挑战
挑战一:ReAct 链路可靠性
挑战二:生产级工程集成
挑战三:金融场景的评测量化
4- 解决思路
4.1 三层意图路由:稳定性的第一道防线
4.2 工具链质量门控:从设计时到运行时
4.3 结构化代码协议:告别 Markdown 解析
4.4 上下文装配优先级与 Token 预算
4.5 生产级工程方案
听众收益:
收益一:获得数据平台全链路 Agentic 化的方法论
不再局限于 Text2SQL 或单一任务开发,而是理解“数据探查-任务开发-发布上线-质量保障-调度运维”如何在统一 Agentic 架构下协同运转,明确平台化建设的分层边界与演进路径。
收益二:拿到可复用的生产级工程实现模板
掌握多 Agent 协作中的关键工程件:意图路由、工具门控、流式编排、状态持久化、权限审计、失败恢复等,并理解这些能力如何在不同业务环节复用,而非为每个场景重复造轮子。
收益三:建立可量化的价值评估与迭代框架
学习如何从“任务成功率”扩展到“平台端到端收益”指标体系(开发提效、发布稳定性、质量拦截率、运维响应时效),把 Agentic 建设从技术试验升级为可持续运营的业务能力。
Agent驱动旅游B2B:全球旅游资源分发的数据架构智能化升级之路
旅游 B2B 全球分发的竞争,早已从资源数量竞争转向数据能力与智能决策能力竞争。以 Agent 为核心的数据架构升级,不仅是技术底座的重构,更是全球旅游 B2B 商业模式的升级,通过数据自治、智能决策,赋能全球旅游资源实现高效流转、精准匹配与持续增长。
演讲提纲:
一. 旅游 B2B 分销的痛点
(1)行业现状:全球旅游 B2B 分发具备复杂格局。全球存在多国家、多语种、多供应商的异构资源,酒店、机票、地接等产品标准不统一,供需波动实时变化,跨区域交易规则、结算体系、政策差异极大,属于典型的高异构、高动态、高并发复杂商业场景。
(2)传统模式核心瓶颈,即 API 静态架构局限性。
数据层面:依赖固定 API 接口拉取数据,资源价格、房态、库存更新滞后,多源数据碎片化,无统一语义标准,数据孤岛问题严重。
决策层面:采用人工加规则引擎的固化运营模式,无法自适应淡旺季、区域流量、竞品波动,动态调价、资源匹配效率已经触顶。
协同层面:全球分销商、供应商对接流程机械化,审核、追价、补库存、异常处理均依赖人工,规模化扩张成本极高。
迭代层面:新市场、新资源接入需要大量定制开发,业务敏捷性无法适配全球化快速扩张的需求。
(3)核心命题:从接口调用的被动式分发,走向 Agent 自治的智能式分发,通过全新数据架构升级,解决全球旅游资源“接得快、管得准、卖得优、跑得稳”四大核心难题。
二. 架构演进:从传统 API 架构到 Agent 原生架构
(1)旅游 B2B 三代架构迭代。
1.0 静态 API 时代:属于数据搬运模式,仅完成资源对接、信息同步,不具备决策能力。
2.0 规则引擎时代:属于自动化流程模式,基于固定策略完成调价、匹配,仅适配简单场景。
3.0 AI Agent 时代:属于智能自治模式,可感知、可推理、可决策、可迭代,适配全球复杂动态场景。
(2)核心差异:API 架构与 Agent 架构对比。
交互逻辑:API 是被动应答,按需调用、流程固化。Agent 是主动感知,可实时监测市场、供需、竞品动态。
数据能力:API 是结构化静态数据传输,无法处理非标、模糊、实时波动数据。Agent 具备数据语义理解、异构融合、动态校准能力。
业务能力:API 只能执行预设流程。Agent 可自主完成资源优选、智能定价、风险识别、异常自愈、策略迭代。
全球化适配:API 对接新市场成本高、周期长。Agent 可自适应区域规则,快速完成本地化适配。
三. 核心落地:适配全球旅游分发的 Agent 数据架构体系
(1)架构顶层设计,四层核心体系为道旅实战落地成果。
第一层:全域数据感知层,即全球化数据源底座。统一接入全球酒店、航司、地接等多品类资源,整合供应商数据、分销商交易数据、市场行情数据、区域政策数据、用户行为数据。完成多语种、多格式、非标数据的清洗、归一化、实时同步,为 Agent 提供完整、实时、可信的全域数据输入。
第二层:数据语义治理层,即 Agent 理解业务的核心。打破传统数据表结构限制,搭建旅游 B2B 专属知识图谱与语义标签体系。统一价格、库存、房型、政策、渠道的业务语义,解决全球异构资源“同物不同名、同名不同义”问题,让 Agent 读懂业务、识别差异、区分场景。
第三层:智能 Agent 决策层,即核心业务大脑。部署多垂直场景自治 Agent,覆盖道旅核心分销场景:
全球资源匹配 Agent:基于分销商需求、区域客源、产品优势,自动完成最优资源组合匹配。
动态定价 Agent:结合供需热度、竞品价格、时段波动、渠道层级,实时智能调价。
库存风控 Agent:实时监控全球库存、房态变化,自动锁房、补库存、预警异常。
渠道运营 Agent:自主分析各区域、各分销商交易数据,优化分发策略、挖掘增量机会。
第四层:业务自愈与迭代层,即持续进化体系。架构具备自动复盘、效果归因、策略迭代能力,Agent 可根据每日交易结果、市场变化自主微调模型参数与业务策略,无需人工频繁修改代码,实现数据→决策→结果→优化的闭环迭代。
(2)架构核心优势,适配旅游 B2B 全球化发展。
高兼容性:兼容存量 API 体系,可平滑迁移、无需彻底重构,降低升级成本。
高实时性:秒级感知全球资源变动、市场波动,支撑实时交易决策。
高自治性:大幅减少人工干预,实现分发流程智能化、无人化运转。
高扩展性:新国家、新供应商、新业务场景可快速接入,支撑全球业务扩张。
四. 业务价值:Agent 驱动的全球分发能力升级
(1)效率价值:全球资源接入、审核、上架效率大幅提升,跨区域分销流程自动化率显著提高,人力运营成本下降,业务交付效率翻倍。
(2)交易价值:依托智能定价、精准资源匹配,可有效提升整体成交量、毛利率、资源周转率,解决传统模式下定价僵化、资源滞销、高价流失等问题。
(3)风控价值:可实时监控全球交易异常、库存漏洞、价格风险,前置规避超卖、错价、违规分销等业务风险,保障全球交易体系稳定。
(4)增长价值:通过 Agent 智能挖掘区域市场机会、分销商潜力,实现精细化、差异化全球运营,支撑新市场、新渠道规模化增长。
五. 落地复盘与行业思考
(1)落地关键经验:旅游 B2B 智能化的核心不是替换系统,而是重构数据与决策的联动关系。Agent 落地的前提是业务语义标准化、数据治理精细化,没有高质量数据就没有智能决策。全球化场景需要兼顾通用智能加区域定制,平衡统一架构与本地化业务差异。
(2)未来演进方向:从单一场景 Agent 自治,走向多 Agent 协同组网,实现定价、库存、渠道、风控、运营全链路智能联动,构建完全 AI 原生的全球旅游资源分发体系。
听众收益:
掌握 AI Agent 适配旅游 B2B 场景的数据架构设计思路。
了解全球多源异构旅游数据的治理、融合与语义化落地方法。
学习从传统 API 架构向 Agent 架构平滑演进的路径与实战经验。
借鉴全球化资源分发场景下,智能架构降本、提效、增收的落地价值。
从 BI 到 Data Agent:传音企业智能分析平台的建设实践与展望
本次分享将结合传音企业数据分析场景,介绍从传统 BI 到 Data Agent 的建设思路:如何把数仓宽表、语义数据集、指标口径、业务知识、分析 Skill 和报告产物组织成一套可运营的智能分析能力。和企业同行共同探讨 Data Agent 如何与BI平台协同演进。
演讲提纲:
1. Data Agent 传音中的定位不再是聊天框,而是企业数据分析基础设施
2. Data Agent 几个关键能力闭环
3. 从问数到分析,再到行动,我们的做法
4. 未来的演进展望
听众收益:
1- 了解传音在 Data Agent 与传统 BI、ChatBI、其他分析引擎的定位差异,避免把智能分析简单做成“聊天框”。
2- 获得一套可复用的建设框架:数据对象、分析自由度、治理等级、语义层、运行态、产物沉淀和评测反馈。
3- 了解可信问数、看板解读、经营报告生成在企业落地时的关键挑战与工程化解决思路。
vivo数据研发治理平台DataAgent能力落地实践
本次分享将揭秘vivo大数据研发治理平台通过DataAgent实现数据研发的智能化转型。我们将聚焦数据开发智能体(DataDev Agent)与数据分析智能体(DataAnalysis Agent)两大核心实践:前者通过Text-to-sql与任务自动编排,测试,将开发从“手写代码”解放为“逻辑编排”;后者基于对话式分析到深度研究,让业务从“找数”升级为“对话即洞察”。
演讲提纲:
一、痛点与目标
从“人适配数据”到“数据适配人”
开发侧:重代码、重运维、经验难以沉淀。
分析侧:门槛高、周期长、洞察不够深入。
二、数据开发智能体
重塑研发链路:从“手工编码”到“智能生成”,Agent驱动全链路任务创建于编排,自动化测试与发布校验。
三、数据分析智能体
重塑消费链路:从“被动取数”到“主动洞察”,对话式分析,智能归因,异动检测,自动生成分析报告。
四、技术架构与保障
统一的Agent技术底座,驱动不同场景的Agent能力,基础夯实,赋能提效,自动测试,安全可控。
五、总结与展望
构建端到端的数据自动驾驶体系
听众收益点:
1- 掌握从“手工编码”到“智能生成”的数据开发提效路径
2- 体验“对话即洞察”的分析新范式,降低数据消费门槛
3- 获取企业级数据平台智能化落地的架构与安全实践
从 BI 到 Agentic BI:面向 Agent 的第三代数据平台建设实践
传统数据平台主要服务人类查询、报表和取数,但在 Agent 时代,数据平台需要进一步成为智能体可理解、可调用、可治理的企业能力底座。
本次分享将结合消费电子企业的数据平台建设实践,介绍如何从 BI、数据资产、指标管理、知识文档和数据服务出发,构建面向 Agent 的第三代数据平台,支撑业务人员通过 Agent 生成分析页面、调用可信数据、沉淀业务语义,并在权限、口径、治理和可观测体系下实现规模化落地。
演讲提纲:
一、业务背景:为什么传统 BI 不够用了
- 企业数据分析仍依赖报表开发、取数排期和人工解释
- 业务真正需要的不是“问答”,而是可复用、可决策、可执行的分析结果
- Agent 时代的数据平台对象从“人”扩展为“人 + Agent”
二、方案选型:从 Text-to-SQL 到 Agentic BI
- Text-to-SQL 解决的是取数入口问题,不能完整解决分析结构、口径治理和交付形态
- Agentic BI 的核心是让 Agent 生成可运行、可交付、可追溯的分析页面
- 采用 HTML 模板、JSSDK、数据服务和托管能力,支撑动态数据页面生成
三、平台架构:面向 Agent 的第三代数据平台
- 数据层:湖仓、指标、主数据、数据服务统一沉淀
- 语义层:指标口径、业务术语、文档知识、使用场景结构化表达
- 能力层:通过 Skill / API / SDK 向 Agent 暴露可控能力
- 治理层:权限、审计、血缘、口径 Owner、质量校验和使用观测
四、落地挑战:从 Demo 到企业级应用的关键问题
- Agent 如何知道该用哪个数据、哪个指标、哪个口径
- 如何避免生成静态页面、错误 SQL 和不可维护代码
- 如何在权限、安全、成本、稳定性之间取得平衡
- 如何让业务人员真正愿意用,而不是停留在技术演示
五、解决思路与阶段性实践
- 用指标管理和业务语义解决“理解问题”
- 用数据服务和 SDK 解决“可调用问题”
- 用 HTML 托管和模板体系解决“可交付问题”
- 用可观测和治理体系解决“可运营问题”
六、未来规划与总结
- 数据平台将从“数据供给平台”演进为“Agent 能力底座”
- BI 将从固定报表走向动态生成、持续演进的 Agentic BI
- 企业数据治理的终局,是让数据被人理解、被 Agent 正确使用、被组织持续运营
听众收益:
1. 理解 Agent 时代数据平台的新定位
听众将理解为什么数据平台不能只停留在取数、报表和 BI,而要升级为 Agent 可理解、可调用、可治理的企业级能力底座。
2. 获得一套 Agentic BI 的产品与架构思路
听众可以参考“HTML 模板 + JSSDK + 数据服务 + 托管治理”的方案,理解如何让 Agent 从生成静态页面,走向生成动态、可信、可交付的数据分析应用。
3. 掌握企业级落地的关键治理抓手
听众将获得关于指标口径、语义管理、权限审计、数据服务、质量校验和可观测运营的实践思路,避免 Agentic BI 停留在 Demo 阶段。
面向 Agentic 的 OLAP 架构探索
随着 AI Agent 的发展与应用,对 OLAP 系统架构提出了新的挑战。首先,Agent 可观测性不同于传统的系统可观测性,不仅仅是“监控”,更是“理解”,其对承载 Agent 调用链路数据的 OLAP 系统提出了更高的要求;其次,OLAP 系统还需要能够支持向量检索和混合检索等功能,以落地 RAG、Agent 记忆等场景;另外,当访问者从人变为 Agent,系统必须具备 AI 级拦截能力,以保障稳定性;最后,我们也在探索基于 OLAP 数据库存储的 Agent 文件记忆功能。
演讲提纲:
一、业务背景
二、基于 OLAP 系统构建 Agent 可观测性能力
三、向量检索与混合检索
四、面向 Agent 的 OLAP 拦截
五、基于 OLAP 数据库的文件记忆探索
六、总结与展望
听众收益:
1. 可观测性升级:如何基于 OLAP 系统构建面向 Agent 的“理解型”可观测性。
2. 混合检索落地:OLAP 原生支持向量检索与混合检索的可行方案与关键挑战。
3. AI 级稳定性防护:当访问者从人变为 Agent,如何设计拦截能力保障系统不被冲垮。
4. 文件记忆探索:基于 OLAP 存储 Agent 文件记忆的新思路与探索方向。
流式交互与实时洞察:Agent架构如何提升数据产品的实用性
当前AI数据分析产品普遍面临“准度是底线,好用是上限”的落地困境。本演讲将解析如何通过流式Agent架构,将“黑盒式查询”重构为“实时交互式工作流”。我们将探讨如何突破传统看板局限,通过底表引导式探索与代码溯源机制,解决分析过程中的信任缺失问题。同时分享如何将动态分析链路沉淀为可复用的“分析资产(Recipe)”,推动业务探索与数仓建设联动。通过实战数据验证,探讨如何让数据Agent从简单的聊天工具,进化为具备长期记忆与资产沉淀能力的智能数据伙伴。
演讲提纲:
核心逻辑:从单点工具到资产化工作流的架构演进
价值位移:数据智能产品的落地痛点
剖析行业现状:为什么单纯追求 AI 输出的“准确率”往往导致产品在业务场景中难以落地?
重塑核心命题:从单一的“问答模式”转向构建完整的“数据分析工作流”。
交互重构:流式 Agent 架构的必要性
架构演进:从传统的“黑盒批处理”模式迁移至支持实时流式输出的协议架构。
核心优势:利用流式反馈降低交互过程中的“黑盒焦虑”,实现人机协同的高效互动。
深度探索:突破“固定看板”的限制
模式转变:由“基于看板查询”升级为“基于底表的引导式探索”。
技术实现:如何让 Agent 具备穿透看板、直接调用底层数据模型的能力。
资产化沉淀:从“过程”到“资产”
逻辑沉淀:解析如何将复杂的分析过程物化为可复用的“分析配方(Recipe)”。
闭环效应:实现业务探索与数据资产建设的自动联动。
总结:构建具备用户身份认知与长期记忆的数据智能系统,完成从工具向“智能数字员工”的演进。
听众收益:
架构设计视野:掌握衡量数据智能产品落地价值的系统工程模型,识别AI落地中“不仅要准,更要好用”的关键系统性设计要点。
技术落地实战:深入理解流式Agent架构如何通过即时反馈机制,解决传统分析链路中的“交互断层”与“信任缺失”难题。
资产管理思路:学习如何将离散的、瞬时的分析逻辑转化为标准化的数据资产,推动从“人工重复分析”向“资产复用与自动化”的范式转移。
守矩驭智:知鸟企培智能体技术体系赋能金融企业高质量发展
企业当前面临合规与业务的双重挑战:
合规管理痛点:员工规模化调度难、监管知识更新不及时、培训效果缺乏量化评估、审计追溯链路不完整,导致合规风险管控成本高、效率低。
业务增长瓶颈:合规要求与销售转化存在天然张力、新人培养周期长、培训内容与业务场景脱节、培训投入的业务价值无法量化,制约组织效能提升。
知鸟依托 AI 智能体构建一体化解决方案,实现合规管控与业务赋能的深度融合,系统性破解双重难题,为金融企业高质量可持续增长提供核心支撑。
演讲提纲:
一、业务痛点:双维度核心矛盾
合规保底线:四大难题
百万级员工规模化调度难
金融监管知识更新滞后
培训效果难以评估、防作弊难
培训记录不规范、审计追溯不达标
销售提效能:四大瓶颈
合规与销售转化存在冲突
新人上手慢、能力复制低效
培训与实战脱节、学用转化率低
培训价值无法量化、ROI 难衡量
二、技术拐点:双难题同步破解的核心支撑
垂直领域大模型语义处理
AI 原生多 Agent 协同框架
知识图谱 + RAG 深度融合
多模态感知与行为分析
三、知鸟智能体落地方案:AI 原生一体化架构
底层支撑
平安金融大模型・知鸟企培大模型
统一治理、脱敏安全的 AI 数据底座
中间层:企业知识库
知识自动更新、冲突检测、合规检查
合规 + 销售融合知识图谱 + RAG 检索增强
应用层:AI原生多 Agent 平台(7 类核心 Agent)
智能总调度、合规知识管家、内容生成、实战陪练
学习督导、销售诊断、合规审计风控
优势:自主决策 / 分布式协同 / 个性化 / 持续演化
交互层:员工端 / 管理员端 / 监管端
双闭环管控
闭环1:合规学习全流程(计划-执行-检查-处理)
闭环2:销售能力提升全流程
双闭环融合:数据互通、任务协同、考核一体化
四、效果与展望
核心价值
保底线:效率提升、风险下降、处罚减少
提效能:新人周期缩短、合规率 / 转化率提升、ROI量化
五、未来展望
被动合规→主动合规→预测式合规
培训工具→业务赋能平台
听众收益:
1- 明晰AI如何让金融合规培训更高效、易落地,降低监管与操作风险
2- 掌握守规矩、控风险前提下,实现业务稳健增长的方法
3- 借助智能培训体系提升员工能力,降本增效,支撑企业高质量发展
Agentic AI重塑金融生产力:平安集团智能体平台的探索与实践
金融行业正在从“可用的大模型”迈向“可落地、可治理、可规模化复制的智能体体系”。平安集团依托自研智能体平台,围绕保险、银行、投资、证券等多类业务场景,构建了覆盖业务咨询、流程执行、经营分析、风险识别、投研辅助、知识服务等方向的智能体应用矩阵,实现了效率提升、体验优化与经营价值释放。
本次分享将结合平安在平台建设与业务落地中的一线经验,介绍金融智能体在真实生产环境中的架构设计、部署模式、治理机制与推广方法,探讨如何打通“模型能力—平台能力—场景能力—业务价值”的完整链路,为金融行业Agentic AI应用提供可复制的参考范式。
演讲提纲:
一、平安AI战略布局
核心战略:"AI in All"与"五智"布局
智能体平台:战略底座,支撑全集团AI应用
二、智能体平台:企业级AI引擎
-智能体平台核心定位
-产品层:"3+1"端云协同体系
-技术层:五大核心能力介绍
三、平安ONE介绍
-产品定位:桌面智能体,职场全能AI助手。依托平安智能体平台,灵活调度全栈技能,自动完成复杂任务
-产品优势:以极简交互、安全可控与平安智能体生态互联,重塑桌面生产力新范式
-全能助手及编程专家功能介绍
四、标杆案例分享
五、安全合规十大管控体系保障
听众收益:
- “让每个人拥有数字军团、超能团队”
- 推动AI从"会说"到"会做"的跨越
- 人人共建 · 人人可用 · 人人受益
从评分卡到智能体:人工智能重塑消费信贷风险管理体系的实践与思考
消费金融风险管理正在从“模型驱动”迈向“智能体驱动”。传统风控体系主要依赖规则引擎、评分卡和机器学习模型,而随着大模型与AI Agent技术的发展,风险管理开始具备“理解、推理、规划、协同与自主执行”能力。
本次分享将重点围绕消费金融核心业务场景,探讨智能体技术如何重构反欺诈、授信审批、额度管理、风险预警与贷后运营等关键环节。结合真实企业实践案例,介绍多智能体协同风控体系在实时风险识别、策略生成、风险调查、催收运营及风险决策辅助中的应用方式,以及如何实现“从模型工具到风险决策中枢”的升级。
演讲提纲:
一、AI Agent如何重构消费金融风险管理
- 从“模型”到“智能体”的能力跃迁
- Agent新增能力:推理、长程决策、多智能体协同、自动策略感知、自主任务规划
- 智能体在风控中的典型架构
二、智能体在风险管理中的典型应用场景
- 智能反欺诈Agent
- 授信审批Agent
- 额度与定价优化Agent
- 贷后预警与催收Agent
三、多Agent协同:未来智能风控体系
- 单点模型到风险决策中枢
- 多Agent协作案例分析
四、基于智能体的消费金融智能风控体系实践
五、AI落地过程中踩过的坑
- 模型准确≠业务价值
- 数据比算法更重要
- AI黑箱与可解释性
- 监管和合规要求
听众收益点:
- 理解消费信贷风险体系的演进逻辑。从规则、评分卡、机器学习到大模型和智能体,建立完整的风险管理认知框架。
- 掌握多智能体框架在风控中的真实落地路径。理解AI不是替代模型,而是构建“规则+模型+大模型+策略”的协同体系。
- 学习大模型、智能体在消费金融机构的实战经验。了解智能体反欺诈、授信审批、贷后预警、策略优化等典型案例,以及落地过程中踩过的坑和解决方法。
Agents 重构金融 FICC 策略全生命周期管理平台
我们的 FICC 业务 2025 年日均成交 1100 亿人民币,日均订单 30 万笔、98% 由策略下单。在这种规模下,"AI 该在哪里、不该在哪里" 比 "AI 能做什么" 重要得多。
去年我们用"玻璃箱 + 无侵入"跑通了第一代,今年遇到的新问题是:模型变强之后,那些精心设计的多层编排脚手架(LangGraph、CrewAI、n8n)反而开始拖更强模型的后腿。"让 Agent 跑起来"已经不够,得回答"让 Agent 越用越强"。
这次分享讲我们的答案:双区架构 + 玻璃箱 v2——研发分析区让 Agent 自由进化、交易核心链路保持确定性、用回测和上线流程做桥、旁路 AI 给实时辅助。在这个边界上,我们用开源 Hermes 替掉 n8n、按 Karpathy 的 Autoresearch 范式让 Agent 在回测里自己进化、用一套金融原生 Generative UI 让一句自然语言变成一份图文并茂的分析报告。
这不是又一个"在金融用了 AI"的故事,是 Agentic AI 在金融真正能上线、能进化、能落地的形态。
演讲提纲:
一、为什么要做第二代
第一代解决的是"AI 在金融能不能用",今年我们要解决的是"AI 在金融能不能越用越强"。这一节快速过一遍业务规模、第一代的底座(玻璃箱+无侵入),讲清楚 v2 要回答的三个新问题——为什么编排要变薄、为什么 Agent 要会自进化、为什么 AI 的产出可以图文并茂。
二、双区架构:AI 该在哪里、不该在哪里
AI 在金融机构落地的核心不是模型选型,是边界划分:研发分析区让 AI 自由进化、交易核心链路保持确定性、用回测+上线流程做唯一的桥、用旁路 AI 提供实时辅助(小泰询报价、盘中风险归因、盘后自动复盘)。
这一节也会回答一个看似矛盾的问题:玻璃箱要求"全程可控",模型变强又要求"少管它"——怎么调和?答案是玻璃箱 v2:管边界,不管步骤。
三、三板斧:轻编排、自进化、生成式 UI
从 n8n 换到开源 Hermes——为什么节点图式编排反而让强模型变笨(这点最近的 In-Context Prompting 论文有实证),以及我们"开源优先 + 严格审计 + 分支管理"的工程哲学:把精力花在业务上,不在重复造轮子上。
Autoresearch 在金融的工程现实——Karpathy 提的"可验证指标驱动 Agent 自进化",在金融比在任何行业都更可行,因为回测就是天然的 ground truth。会讲我们怎么定指标、进化什么、不进化什么(划重点:不动模型权重),以及怎么用影子运行 + 人工采纳兜底。现场演示同一个回测任务,新版 Agent 比旧版强了多少。
金融原生 Generative UI——通用 Generative UI 给的是通用图表,金融分析要的是 K 线、收益率曲线、回撤、归因瀑布、IC 热力图。一套领域专用组件库 + Agent 自主编排,让一句自然语言变成一份图文并茂的专业分析报告。
四、几条工程心得
走完这一程,想留给同行五句话——划边界比选模型重要;玻璃箱 v2 管边界不管步骤;可验证指标是自进化的命根子;开源 + 审计比全自研更成熟;进化只在 prompt、skill、路由这一层,不动模型权重。
落地痛点:
指标设计比想象中难。工程层指标容易拿,业务层指标(如样本外 Sharpe)受数据集、口径、时间窗影响极大,没有标准化的可验证数据集,自进化的"提升"很容易就是过拟合的假象。
人工采纳是隐形税。要兜住自进化的失控风险必须有 Owner 把关,但 Owner 的时间成本反过来又会吃掉 Autoresearch 的效率红利。这个平衡点不好找。
开源治理远比想象中重。开源优先省下了造轮子的成本,但每一个开源依赖都要走 fork、审计、合规、跟踪上游——这对团队的工程纪律要求远高于纯自研。
双区架构的边界容易松。任何一次"为了快速上线"而松动边界的尝试,都可能成为日后系统性风险的源头。这件事必须靠工程刚性手段守护,不能只靠流程约定。
生成式 UI 里的领域真实性。LLM 在通用 Generative UI 里很炫,但在金融里,涨跌色、年化口径、报告骨架都不能让它即兴发挥——怎么让组件层守住金融惯例、又不限制 Agent 的创造力,是一个需要长期打磨的事。
前沿亮点:
双区架构——明确划出 AI 在金融机构的边界。这套形态可被其他高合规行业(医疗、法律、监管型行业)借鉴。
玻璃箱 v2——从"管每一步"演进到"管边界、放自主",呼应 In-Context Prompting 论文的结论,是模型变强之后必然要走的一步。
开源 Hermes 替掉 n8n/langchain——配合"开源优先 + 严格审计 + 分支管理",给大型机构提供了"既要社区红利又要合规"的工程范式,而不是简单陷入"全自研"的工程债。
金融可上线的 Autoresearch——把 Karpathy 的范式落地到生产环境,明确划出"只动 prompt、skill、路由,不动模型权重"的工程边界,可上线、可回退、可审计。
金融原生 Generative UI——让一句自然语言变成一份图文并茂的专业分析报告,组件层守住领域惯例,Agent 在约束内自主组合。
听众收益点:
一套在严肃行业落地 Agentic AI 的工程范式(双区架构 + 玻璃箱 v2),不只在金融适用。
模型变强之后架构该怎么走——不是"更复杂",是"更轻、更自主、边界更清晰"。
一份金融级的自进化实践方案——可上线、可回退、可审计。
一种"开源 + 审计"的工程哲学,给大型机构推动 AI 现代化一条参照路径。
AI驱动金融营销合规审核
基金营销素材每周数千套对外投放,但法务审核覆盖率仅10%,人力锁定4.5人、周期3-5天,90%素材处于合规"裸奔"状态。我们构建了一套基于Agent架构的AI合规审核系统:采用"多模态识别+文生文推理"解耦方案替代端到端推理,解决VL模型推理能力弱、长图细节丢失的问题;通过数据合成+SFT+RePO强化学习训练专项模型,将通用大模型40%的准召率提升至准确93.8%/召回94.7%,推理速度从128s降至40s,部署资源从16xH20降至4xH20;同时设计规则自进化闭环实现小时级规则更新。最终实现审核覆盖率从10%提升至100%,等效释放11人法务人力。
演讲提纲:
一、业务背景与痛点
金融营销合规的监管环境:7部法规约7万字构成的合规红线
四组困境数据:覆盖率10%、人力18人天/周、周期3-5天、标准不一致
核心矛盾:素材量指数增长 vs 人力线性增长,不可能靠加人解决
二、方案选型与技术架构
整体Agent架构设计:感知/工具/提示词/行动/记忆五模块协同
关键决策1:为什么选"识别+推理"解耦而非端到端?(四个不可行原因)
关键决策2:规则如何从7万字法规翻译为5大类21小类结构化定义?(5步转化方法论)
三、落地挑战与解决思路
挑战1:长图细节丢失 → 智能切图方案(F1提升16%)
挑战2:合规判断需外部数据 → MCP工具链(基金持仓/成立时间查询)
挑战3:违规定位无单一方案全覆盖 → EasyOCR+Grounding DINO+SAM三引擎组合(图像定位60%→90%+)
挑战4:通用模型准召仅30% → 数据合成+SFT+RePO专项训练(准确66.8%/召回84.7%,速度提升3倍,资源降75%)
挑战5:规则自进化闭环:AI归纳→法务确认→即时生效,无需重训
挑战6:视频/直播审核:三阶段路径(ASR复用→帧级检测→Video-LLM)
四、模型训练深度解析
数据合成:正向+反向双路径,解决垂直领域零数据问题
SFT:数据配比/指令遵循/推理上限三原则
RePO强化学习:Rephrase机制实现RL中的知识注入(vs Offline/Online RL的局限)
非对称Loss:高召回偏置设计,匹配"宁错杀不放过"的业务需求
五、未来规划
视频直播实时审核
监管文件与新闻推动合规规则更新
六、总结
核心成果:覆盖率10%→100%,等效释放11人力,40s完成单次审核
技术亮点提炼:解耦架构、智能切图、三引擎定位、RePO训练范式、规则自进化
听众收益:
1. 掌握大模型在垂直合规场景的落地方法论:如何将7万字法规转化为模型可执行的结构化规则、如何通过"识别+推理"解耦突破VL模型能力瓶颈、如何用MCP工具链补齐模型无法获取的外部信息——这套方法论可迁移至广告审核、内容安全、医疗合规等任何"规则密集+多模态"场景。
2. 获得小模型超越大模型的专项训练实战经验:通过数据合成(正向+反向双路径解决零数据困境)、SFT+RePO强化学习的组合范式、以及非对称Loss设计匹配业务偏好,一个4xH20部署的小模型在垂直场景全面超越16xH20的671B通用大模型——这对所有受限于算力预算的垂直场景团队有直接参考价值。
3. 理解多算法协同的工程化组合思路:没有银弹算法能解决所有问题(如定位场景中6种方案各有短板),关键在于精准识别每种算法的能力边界,通过LLM路由+多引擎协同实现全覆盖——这种"组合优于单一"的工程思维适用于任何复杂AI系统的构建。
移动端 GUI 执行的 Agent Harness 探索
随着用户需求从信息获取转向任务执行,Agent 不再只是对话问答,而是需要在手机上完成明确的任务 - 点单、打车、预约、查询等跨 App、跨页面的复杂操作,为用户解决高频重复和低频复杂的执行任务。因此,方案从传统文本问答演化为多模态 Agent:一方面通过模型训练提升对移动 GUI、页面状态和操作意图的理解能力,另一方面通过系统框架支撑任务规划、动作执行和状态管理。
在真实落地中,移动 GUI 的复杂交互逻辑、回退路径、弹窗广告和动态页面变化,使得单一模型或固定脚本难以稳定运行。为此,系统进一步演化为多智能体协同架构,并结合模型在线强化、端云协同感知和知识库沉淀,提升异常处理、任务恢复和长期泛化能力。从行业榜单能力提升走向业务场景落地,形成面向移动设备的通用自动执行能力。
随着执行能力的不断演进,GUI Agent 的下一步是在执行过程中更了解用户、提供更贴合实际需求的执行、主动为用户减少交互困难,以及更流畅、更智能的数字助理。
演讲提纲:
业务背景:用户从对话问答转向任务自动执行的需求转变,以及 Agentic AI 能力的不断成熟,催生移动设备 GUI Agent 的应用落地。
方案选型:多模态 Agent - 训练、框架
落地挑战:GUI Agent 在移动设备的复杂交互逻辑、回退机制以及弹窗广告的动态性
解决思路:模型在线强化学习训练、多智能体框架、端云协同状态感知、hybrid 状态知识库
解决成效:业务落地效果
听众收益:
1. 了解当前手机厂商 GUI Agent 的现状及挑战
2. 提升如何通过训练和 Harness Engineering 提升 Agent 业务上线能力
Harness Engineering:大模型Agent执行与控制的系统化工程——从并行计算到智能体编排
大模型从“问答”走向“行动”时,Agent的执行与控制成为新的工程瓶颈。提示词工程和上下文工程解决了模型“理解”的初步问题,但面对多步推理、工具调用、状态持久化、异常恢复及并发调度等真实场景,我们需要一套系统化的工程方法——Harness Engineering。
Harness Engineering 借鉴了并行计算、分布式系统和实时控制的思想,为Agent提供确定性的执行环境、可观测的控制流和容错的运行机制。本演讲将首次系统性地阐释Harness Engineering的核心技术要素,并结合在高性能计算(英伟达、华为)及智能汽车(商汤、足下科技)领域的实践经验,分享如何设计可扩展、高可靠的Agent执行与控制工程体系。听众将获得从“模型能力”到“工程落地”的关键跃迁思路及可复用的技术模式。
演讲提纲:
一、大模型落地的工程鸿沟:为什么需要Harness Engineering?
真实Agent应用的典型失败模式:循环失控、工具调用悬挂、状态丢失、部分失败
提示词工程与上下文工程的局限:无法保证确定性、缺乏系统级控制
Harness Engineering的定义:Agent执行生命周期的编排、调度、监控与容错工程
二、Harness Engineering的四大核心支柱
2.1 执行状态机与事件驱动架构
Agent状态定义:idle/running/waiting_for_tool/error/retry
基于事件的动作触发与超时控制
实践:使用状态机避免Agent死循环与无限推理
2.2 工具调用协议与沙箱执行
标准化工具描述(OpenAPI/JSON Schema)到可执行调用的转换
工具调用的并发控制、速率限制与资源隔离
安全沙箱:限制工具的能力边界
2.3 并行与异构调度:从多Agent到多设备
基于DAG的任务并行拆解
多Agent协作的调度策略:轮询、优先级、负载感知
异构执行:CPU处理逻辑,GPU/NPU加速模型推理,协程处理I/O等待
2.4 可观测性与自愈工程
全链路追踪:Span设计
指标采集:步骤耗时、工具成功率、循环次数分布
自愈模式:指数退避重试、降级输出、人机回环(HITL)
三、技术实践:足下科技在智能汽车领域的Harness Engineering落地
案例1:车载多模态Agent控制车辆功能
工具调用的实时性保证(<100ms)与优先级抢占设计
关键指令的二次确认与异常时的安全回滚策略
案例2:研发场景下的自动化测试Agent
并行执行数百个测试用例
部分失败时的结果聚合与自愈重试
案例3:基于Harness的低代码Agent编排平台
可视化拖拽+状态机生成
从个人实验到企业级服务的工程化要点
四、未来演进:Harness Engineering + 自适应控制
基于反馈的动态参数调整
元Harness:用Agent管理Harness自身的配置与升级
与形式化验证的结合:对关键路径进行模型检验
五、总结与行动建议
Harness Engineering是Agent从“Demo”到“产品”的必经之路
落地三步走:先定义状态与错误处理 → 再建立可观测性 → 逐步引入并行与自愈
推荐开源参考框架及自研要点
听众收益:
- 掌握Harness Engineering的核心理念:理解为什么传统提示词工程不足以支撑生产级Agent,以及Harness如何填补空白。
- 获得可直接落地的技术模式:包括状态机设计、工具调用沙箱、并发调度算法、可观测性埋点等具体实现思路。
- 了解来自智能汽车等高可靠领域的实践:如何在高实时、高安全要求的场景下设计Agent执行与控制逻辑。
数据科学 Agent Harness 的探索与实践
微信实验平台支撑大量实验与策略评估,传统分析需人工串联指标口径、数据抽取、统计检验、Notebook 脚本和报告撰写,难复查、难复用。我们从单点 Chatbot 转向 Agent Harness,以 XAgent 承接实验报告、CUPED 和电商因果分析,以 AgentOS 组织协作、工具执行、观测与评测回放,沉淀证据链报告和可信决策流程。
演讲提纲:
1. 业务背景:微信实验平台中实验报告、CUPED、因果分析等任务为何不能停留在单点 Chatbot。
2. 方案选型:从问答式入口、脚本自动化到 Agent Harness,说明 XAgent、AgentOS 和 Harness 的分工。
3. 落地实践:介绍证据链实验报告、CUPED 策略优化、电商 Fast Causal Inference 因果分析三个案例。
4. 评测与挑战:分享受控执行、人工审查、因果 Skill 拆分和多层评测体系。
5. 未来规划:通过评测回放、策略沉淀和工程闭环,持续优化实验决策能力。
听众收益点:
1. 理解实验分析 Agent 从 Chatbot 走向 Agent Harness 的必要性,掌握生产级分析 Pipeline 的关键能力。
2. 获得微信实验平台在证据链报告、CUPED 策略优化、因果分析 Skill 化方面的落地经验。
3. 了解复杂分析任务如何通过 AgentOS 组织团队协作、过程观测、评测回放和可信产物沉淀。
Harness Agent在实际业务中的落地现状和未来发展
随着大模型能力持续突破,Harness 编程(即通过结构化方式“驾驭”大模型完成复杂任务)已从概念走向主流。然而,在实际业务中落地 Harness Agent 时,企业往往面临效果不稳定、成本失控、安全风险、评估困难等一系列现实挑战。如何在大模型时代真正用好大模型,让 Harness Agent 从“可用”变为“可靠”,是每一位技术决策者和开发者都需要深入探讨的紧迫话题。
演讲提纲:
一、Harness Agent 的发现
- 从大模型能力涌现到 Harness 编程思想的诞生
- Harness Agent 与传统 Prompt 工程、Chain/Flow 的区别
- 关键驱动力:模型推理能力的提升与工具调用(Function Calling)的成熟
- 实际业务中哪些场景天然适合引入 Harness Agent
二、Harness 如何在自己实际项目中落地
- 落地前的决策框架:自研 vs 开源框架 vs 商业平台
- 典型案例分享:
- 企业内部知识问答与复杂报告生成
- 多步数据清洗与分析流程
- 跨系统业务操作自动化(如 CRM、工单系统)
- 从单 Agent 到多 Agent 协作的模式选择
- 落地过程中的工程基建:日志、追踪、缓存与成本控制
三、Harness 在实际落地中暴露的问题及如何规避
- 效果问题:Agent 易陷入循环、多步推理累积误差 → 引入规划校验与提前终止机制
- 成本问题:大模型反复调用导致 Token 消耗爆炸 → 设计“决策-执行”分离架构、用小模型做路由器
- 可控性问题:输出格式不稳定、指令遵循偏差 → 结构化输出约束、带反馈的自纠错回路
- 安全与合规问题:Agent 访问敏感数据、执行危险操作 → 权限沙箱、人类在环(Human-in-the-loop)、审计日志
- 评估难题:缺乏标准的 Agent 评估数据集 → 构建任务完成率、步骤效率、人工验收三元评估体系
- 团队认知问题:把 Agent 当成万能胶 → 明确 Harness 的适用边界,建立快速失败(fail-fast)机制
四、Harness 未来的发展
- 模型侧提升:更强的基础推理能力与长期记忆机制
- 框架侧演进:从“编排”走向“自组织”的 Agent 网络
- 工具生态:统一 MCP(模型上下文协议)标准,降低接入成本
- 行业趋势:垂直领域的 Harness Agent 将率先成熟(如金融、医疗、软件工程)
- 实用主义预测:未来 1-2 年,“轻量级 Harness + 本地小模型”会成为中小企业标配
听众收益点:
1. 明确 Harness Agent 的适用边界**:学会判断自己的业务场景是否适合引入 Harness Agent,避免盲目跟风造成资源浪费。
2. 掌握一套可复用的落地方法论:从需求分析、架构选型到工程基建,获得端到端的实施路径,减少试错成本。
3. 避开真实业务中的典型“坑点”:提前预知效果不稳定、成本失控、安全风险等常见问题,并学会对应的规避策略与工程手段。
4. 建立 Harness Agent 的效果评估体系:不再只凭“感觉”评价 Agent 好坏,能够用任务完成率、步骤效率等可量化指标驱动迭代。
5. 洞察未来 1-3 年的技术演进趋势:了解模型、框架、工具生态的发展方向,为自己的技术规划和团队布局提供决策依据。
三层解耦 × 三大Agent:货拉拉私域营销的多模态引擎实战
本次分享基于货拉拉私域营销实践,针对传统私域依赖人工、素材生产效率低、转化难的痛点,介绍多模态Agent落地的全链路技术方案。我们采用三层解耦的Multi-Agent架构,打造AI质检、多模态素材生成、问答交互三类专属智能体,落地过程中解决了大模型素材品牌一致性弱、Agent规则引擎灵活性不足、多系统对接时延高等核心问题。上线后实现私域质检覆盖率100%、人工复核成本降低70%、用户异议处理成功率提升65%、私域整体转化率翻倍,沉淀的可扩展框架可快速适配多行业私域场景。
演讲提纲:
一、开场:为什么我们要做私域多模态Agent?
私域运营的普遍痛点:从我们转化率不足2%的真实困境说起
多模态Agent的价值:不是技术炫技,是真刀真枪解决效率+转化问题
本次分享核心价值:可落地、可复制的货拉拉实践经验
二、方案逻辑:Multi-Agent架构的核心设计思路
整体架构定位:三层解耦的全链路闭环设计,兼顾灵活性与可复用性
三大核心Agent的协同逻辑:
AI质检Agent:守住合规与运营标准的底线
多模态素材生成Agent:搞定高效精准的内容生产
问答交互Agent:承接用户全场景实时交互
三、关键实践:我们踩过的核心坑与解决方案
内容一致性问题:大模型生成素材忽上忽下,怎么对齐品牌调性?
灵活性与标准化的平衡:Agent太死板卡壳、太灵活违规,怎么权衡?
业务接受度问题:运营不愿意用AI工具,怎么推进落地?
性能与成本的平衡:多模态生成慢、成本高,怎么优化?
四、落地效果与可复用经验
真实数据结果:效率、效果、成本三个维度的落地收益
轻量化落地路径:不需要大团队也能快速复用的分步落地方法
跨行业适配思路:这套框架怎么快速迁移到其他私域场景
听众收益:
多模态运营体系:掌握邀约场景下企业微信多模态素材的系统化运营思路,搭建高效邀约体系
如何精准匹配:学会针对不同客户精准匹配素材类型,让邀约信息更具吸引力与转化力
运营标准:获取可直接落地的多模态素材运营标准,实现从内容到结果的闭环增长
Foundation Protocol:AI 社会的基础协议与协调底座
AI Agent 正从单点工具走向开放协作,但发现谁、信任谁、如何协作、如何交易、如何沉淀声誉,仍缺少共同语义。Foundation Protocol 将 Agent、人类、工具、服务和组织统一建模为可寻址实体,用同一套协议表达身份、关系、会话、策略、交易与审计。本演讲将结合应用实现与协议选型,分享 FP 如何成为 MCP、A2A 等协议共同依赖的协调底座。
演讲提纲:
1. 业务背景:单个 Agent 越来越强,但多 Agent 社会仍缺少共同协议。
2. 核心问题:发现、协作、交易、信任、声誉为什么不能长期散落在 prompt、日志和私有 API 中。
3. 方案选型:FP 与 MCP、A2A 的关系,为什么 FP 更适合作为共同基座,而不是替代某个点协议。
4. 核心抽象:Entity、Host 如何把人、Agent、工具、服务和组织放进同一张协作图。
5. 治理机制:Checkpoint Pipeline 如何承载审批、权限、预算控制、策略判断和审计证据。
6. 交易与信任:通过 Contract、Arbiter、Signature、Encryption、Reputation 如何支撑可信交易。
7. 应用落地:结合 AI-Link-Net 等应用实现,说明协议对象如何进入真实协作流程。
8. 未来规划:让 Agent 具备可迁移身份、可验证履约记录和跨组织协作能力。
9. 总结:FP 的目标不是再造 Agent 框架,而是补上 Agent 社会反复需要的协调底座。
听众收益:
1. 理解 Agent 从工具变成行动者后,发现、协作、交易、信任和声誉为什么需要共同协议。
2. 掌握 FP 的核心抽象,包括 Entity、Host、Envelope、Checkpoint、Contract、Arbiter 和 Reputation。
3. 获得一套协议选型视角:如何判断 MCP、A2A 与 FP 的边界,并把局部能力放进统一协作语义中。
系统化AI辅助研发破解定制难题——多Agent协同、代码逆向与生成式AI的工程化落地
在全球化业务背景下,软件产品需要面向多个国家/地区进行定制化适配(如UI、业务规则、合规要求等)。传统DevOps与敏捷开发方式在面对“1个核心底座+N种定制变体”时,普遍暴露出重复开发、知识孤岛、质量参差不齐、交付周期长等痛点。以LLM为代表的AI技术为这一困境提供了新的解法,但零散的代码生成工具难以系统化解决工程落地问题。
本次演讲将从真实业务挑战出发,首次系统分享OneCodeBase实践的完整思路:如何通过多Agent协同、代码逆向工程、知识挖掘和知识工程等技术,实现对全球化定制开发效率的系统性提升,为正在探索AI辅助研发的团队提供可复用的实战参考。
演讲提纲:
1. 软件1+N客户化定制适配面临挑战
2. 系统化AI辅助研发思路与方案
整体思路:
- 领域知识自动萃取与挖掘,将隐含在文档和代码中的离散或隐含领域知识自动进行萃取与挖掘,定义与构建不同层级的领域知识和知识库,比如领域知识包括L1 Knowledge Cube、L2 Function Knowledge和L3 Scenario Knowledge,知识不再是What的问题,更要回答Why和How等问题;
- 构建场景化可范式的需求即应用能力,可范式场景在一线可闭环;
- 构建开发E2E流程闭环能力,实现需求理解与澄清、代码生成、验证、上库等流程闭环能力,并将领域知识注入流程,支撑AI Coding环节软件实现设计和业务代码生成;
- 基于可组合的测试因子实现需求到自动化用例自动生成与执行;
关键创新点:
- 领域知识挖掘工程:自动从历史定制代码和文档中全量与增量萃取与挖掘领域知识;
3. 总结与展望
系统化AI辅助研发 ≠ 堆砌大模型API,而是一套从问题出发的工程体系
未来的挑战:知识飞轮,如何将知识萃取、管理、应用和反馈建立闭环,形成基于领域知识的自我演进;
听众收益点:
- 掌握系统化知识挖掘方法,破解“1+N”定制中的知识孤岛与重复开发难题
- 获得端到端AI辅助研发闭环的实战参考,缩短交付周期并提升质量一致性
能力契约驱动的企业级 Agent 执行范式:Dynamic Workflow 的运行时展开
企业级 Agent 的核心矛盾,不是模型能否调用工具,而是能否在长周期、多步骤、有副作用的任务中持续掌控流程。固定 Workflow 治理清晰但适应性不足;自由 Agent 具备探索能力,却难以稳定满足权限、审计和恢复要求;Workflow + Free-agent Node 是现实折中,但动态性主要停留在节点内部,跨节点补证、重排、回退和提前完成仍依赖预设分支。
本次分享提出一种能力契约驱动的企业级 Agent 执行范式:将业务 SOP 转化为 Agent 可理解、执行底座可承载的 Skill Set Package,用能力边界、适用条件、验证规则、工具权限和状态提交机制定义可执行空间。Agent 基于当前状态和证据质量动态编排下一步;执行底座负责校验、调度、审计与恢复。该范式的目标不是弱化 Agent,而是让 Agent 的流程决策进入可验证、可追溯、可恢复的企业级执行过程。
演讲提纲:
1. 企业级 Agent 的核心矛盾
- 复杂任务需要动态补证、修订、回退、暂停和提前完成。
- 企业系统同时要求权限、预算、审计、恢复和可诊断性。
2. 现有三类范式的边界
- 固定 Workflow:治理简单,但路径适应性不足。
- Free Agent:探索能力强,但系统边界不稳定。
- Workflow + Free-agent Node:单节点灵活,但跨节点动态仍依赖预设分支。
3. OpenSpec 带来的工作结构启发
- Actions、artifacts、dependencies、verify 和 archive 提供了组织复杂工作的参考。
- Dependency 是 enabler,不是强制路径;verify 是复杂工作收敛机制。
4. 能力契约与 Skill Set Package
- 交付物不再是流程图,而是一组 Agent 可理解、执行底座可承载的能力契约。
- Skill Set 描述能力边界、适用条件、输入输出、验证规则、权限和失败处理。
- SOP 保持稳定,执行轨迹由 Agent 根据状态和证据动态展开。
5. Agent 主导的 Dynamic Workflow
- 执行底座暴露目标、状态、证据、候选能力和策略约束。
- Agent 动态选择下一步,执行底座完成校验、调度、状态提交和审计记录。
6. 适用边界与评估方法
- 适合高价值、多步骤、长周期、有工具副作用且路径不确定的任务。
- 通过成功率、人工介入率、成本、延迟、失败可诊断性、可复现性和越权/违规率评估方案价值。
听众收益:
1. 建立判断企业级 Agent 执行范式的框架,区分固定 Workflow、自由 Agent、Workflow + Free-agent Node 与 Agent 主导的 Dynamic Workflow。
2. 理解 Skill Set Package 作为交付物的设计方式:如何定义能力边界、适用条件、验证规则、权限策略和状态提交机制,使 Agent 能在边界内动态编排。
3. 获得一套生产化评估方法,判断哪些任务值得采用该范式,并用成功率、人工介入率、成本与延迟、失败可诊断性、可复现性和越权率评估效果。
Elastic MCP 及 Agentic AI - 构建可信、上下文感知能力的搜索
Elasticsearch 正从全球领先的搜索引擎进化为 Agentic AI 的核心基础设施。 针对大语言模型(LLM)知识静态且缺乏实时数据访问能力的痛点,Elastic 推出了 MCP(模型上下文协议),旨在将孤立的推理引擎与外部世界无缝连接。依托 Elasticsearch 强大的向量搜索与混合搜索能力,企业可以构建具备 “上下文感知” 的高质量检索基础,并将对话历史作为长期记忆存储,有效消除 AI 幻觉。高效及准确的上下文感知是构建 AI agents 的关键因素。创建 Agents 及 tools 对于很多企业应用来说不是很容易的一件事。随着最新 Elastic 版本的推出,开发者可以在弹指之间通过 AI Agent builder 轻松创建 tools, skills 及 Agents。
这些 Agents 可以让用户轻松地使用人类自然语言对企业数据进行分析查询总结。开发者可以通过 ES|QL (类似于 SQL 查询)创建工具。对数据进行查询,统计分析,多表格关联查询形成丰富的精确的上下文供大模型进行使用;使用 MCP 来创建工具,调用其它专业/专用 MCP 服务器所提供的工具给 Elastic AI agents;通过 Workflow 来创建工具,自动化工作流。
开发者可以通过 workflow 来完成清晰而明确的工作流执行,这其中包括对已经创建的 agents 调用,对数据的管理(删除,生成等),分类,通知发送,外部 API 的调用(地理编码,天气查询等)等。这些都可以为大模型提供精确感知的上下文,从而达到更加精确的控制。Elastic Workflows(工作流)与 Elastic Agent Builder(智能体构建器)允许你将确定性的自动化流程与对话式推理能力相结合。通过在工作流执行过程中直接调用 AI 智能体,你可以将其视为一个 “推理引擎”,用于对数据进行摘要、对事件进行分类或做出决策,随后将结果传递给自动化流程中的下一个环节。AI Agents 也运行 skills。它为 agent 提供针对特定任务类型的专业能力(instructions/tools/context)。 Elastic Kibana 集成的 MCP 及 A2A 服务器可供第三方应用通过 API 进行调用。
从 BizDevOps 到 VibOps:基于 spec-first 的企业级 AI Coding Agent 工具链实践
企业落地AI Coding后,常见问题不是模型不够强,而是知识、规范、上下文、工具执行和交付证据没有统一,个人提效难以转化为团队交付提效。本次分享结合金融科技研发实践,介绍从BizDevOps到VibOps的演进:以VibOps构建AI时代产研测协同与智能交付平台,以妮蔻(内部工具)作为统一入口与工具编排层,以开源spec-first构建AI Coding Harness能力底座,覆盖Spec驱动开发、Review治理、Evidence验证、Knowledge沉淀和bug-fix缺陷回流,推动准时交付率从78%提升至96.5%,Bug率同比降低80%+。
演讲提纲:
一、业务背景
1、AI Coding 已经进入研发团队,但个人编码效率提升不等于团队端到端交付效率提升。
2、研发流程中,PRD、代码、规范、测试反馈、部署状态和历史经验分散在不同系统。
3、每个人喂给 AI 的上下文不同,导致同一个需求生成的方案、代码和测试口径不一致。
核心诉求:从个人 AI Coding 走向团队级智能交付,让 AI 研发过程形成可治理、可验证、可沉淀、可进化的工程闭环。
二、方案选型
1、选型定位:不是做零散 Prompt 工具,而是构建面向企业研发流程的 AI Coding Agent 工具链,让 AI 能进入真实研发流程,而不是停留在对话式代码生成。
2、范式升级:从传统 BizDevOps 演进到 VibOps,先统一知识、规范、交付和 AI 能力,再通过 Agent 放大研发效率,推动个人 AI Coding 走向团队级智能交付。
3、技术抓手:以开源 spec-first 作为 AI Coding Harness 能力底座,串联 PRD、发布单、代码上下文、Spec、Plan、Work、Review、Evidence 和 Knowledge,让研发过程可治理、可验证、可沉淀、可进化。
4、工具编排层:以妮蔻作为统一入口和执行工具,承担工具编排层的角色,连接飞书协作、本地 AI 能力、研发 Workspace、构建部署、日志排障和状态追踪,把 Agent 能力落到真实研发执行链路中。
三、落地挑战
1、上下文挑战:AI 输入来源不统一,PRD、聊天记录、代码、日志和历史经验缺少统一组织。
2、规范挑战:团队编码规范、API 标准、Review 口径无法稳定注入 AI 执行过程。
3、证据挑战:AI 生成代码后缺少测试、日志、部署、Review 和回写证据,难以判断是否真正完成。
4、组织挑战:好的 Prompt、Bug 根因、修复经验和 Review 结论散落在个人对话中,无法形成组织级资产。
5、闭环挑战:提测后的 Bug 回流仍依赖人工查日志、定位代码、修复、部署和回写,重复劳动明显。
四、解决思路
1、流程层面:构建“需求输入 → Graph → Spec → Plan → Work → Review → Evidence → Knowledge”的 AI Coding 闭环。
2、Harness 层面:通过 Context、Execution、Evidence、Review、Knowledge 五类 Harness,把 AI 放进稳定的工程系统。
3、缺陷回流层面:spec-first 内置 bug-fix 能力,覆盖 reqId / 缺陷 URL、日志定位、根因分析、方案确认、修复、CR、部署和飞书回写。
4、执行链路层面:妮蔻打通飞书入口、研发 Workspace、项目拉取、构建、Sonar、部署、Pod、日志和状态追踪。
5、沉淀层面:将 Spec、Evidence、RCA、Review 结论、Bug 根因和修复经验沉淀为下一次 AI Coding 的上下文。
五、未来规划
1、知识:构建可持续进化的 AI 上下文底座。
2、工具:完善企业级 Agent 工具链与编排能力。
3、端到端:打通从需求到缺陷回流的智能交付闭环。
六、总结
1、企业 AI Coding 的关键不是让 AI 多写代码,而是把 AI 放进统一上下文、标准流程、验证证据和知识沉淀体系。
2、VibOps 是从传统 BizDevOps 演进而来的 AI 时代产研测协同与智能交付平台。
3、妮蔻负责统一入口和执行链路,spec-first 负责 AI Coding Harness,并通过 bug-fix 覆盖缺陷回流。
4、最终目标是让每一次任务都增强下一次 AI Coding,而不是每次对话都从零开始。
听众收益点:
1、理解企业级 AI Coding 的核心挑战
理解为什么个人 AI Coding 提效不等于团队交付提效,以及知识、规范、上下文、工具执行和交付证据不统一,如何成为企业 AI 落地的主要瓶颈。
2、获得 AI Coding Harness 的实践方法
掌握 spec-first 作为 AI Coding Harness 的设计思路,学习如何通过 Spec、Plan、Work、Review、Evidence、Knowledge,把 AI Coding 从一次性生成升级为可治理、可验证、可沉淀、可进化的工程闭环。
3、获得从 BizDevOps 到 VibOps 的架构参考
了解如何通过 VibOps 平台、spec-first 能力底座、妮蔻工具编排层和 bug-fix 缺陷回流能力,把飞书协作、研发执行、构建部署、测试反馈、Bug 修复和知识沉淀连接成企业级 Agent 工具链。
从自动化到自进化:大数据运维Agent实践与思考
本次分享聚焦于大数据运维领域的智能化转型实践。面对传统运维“人不够、活太多、风险高、效率低” 的核心痛点,我们探索并落地了以 “智能体” 为核心的解决方案。
分享将详细介绍我们在应用巡检、SQL诊断、故障自愈等六大真实场景下的实践案例,展示如何通过技术手段将重复劳动自动化、将人工经验标准化。同时,我们将坦诚复盘落地过程中的挑战与经验,如 “规则先行、模型辅助” 的策略和 “小步快跑” 的迭代方法。最后,将分享我们对运维智能化的后续规划,旨在为同行提供一套可借鉴、可落地的实践路径,共同推动运维工作从 “体力活” 向 “价值活” 转变。
演讲提纲:
一、开场:我们为何要做智能体
1、运维困境与核心痛点
2、智能化转型的必要性
二、我们的解法:运维智能体
智能体定位与技术理念
定位:解放人的“数字化工人”
理念:规则先行,模型辅助
整体规划与技术布局
四大场景:优化治理、日常运维、故障管理、价值提升
技术栈:Ansible自动化、MCP跨组件、大模型应用
三、核心实践:六大场景案例
1、系统运维智能助手
技术方案:自然语言处理(NLP)+技能(Skills)封装
核心成效:降低操作门槛,统一执行标准
2、Hadoop 集群自愈智能体
技术方案:实时探针+闭环自愈脚本
核心成效:故障处置时间< 5 分钟,成功率98%+
3、OLTP 数据库预警自愈智能体
技术方案:性能指标监控+4A联动
核心成效:稳定性提升至 99.9%,巡检工作量减少 85%
4、UCX 工具故障分析智能体
技术方案:全链路日志采集+AI 根因分析
核心成效:问题定位效率提升50%
四、未来展望与总结
听众收益:
1、了解如何从自身运维痛点出发,通过“小步快跑、快速验证” 的方式,将智能化理念转化为实际生产力,避免陷入技术陷阱。
2、获得可复用的场景化解决方案:通过六大真实案例,听众可以借鉴在巡检自动化、故障自愈、代码质量管控等具体场景下的技术实现和业务成效,为自身工作提供参考和灵感。
大模型自进化工程实践
在自研 Agent 平台上让 Agent 不训权重也能越用越聪明,是我们的一项核心工程。我们沿记忆、Skill、轨迹三线落地自进化:轨迹沉淀为可复用策略、Skill 执行中自我打磨、in-context 免训练迁移经验。难点不在能不能进化,而在会不会变差。为此在工程实践上必须考虑防退化机制,配合合理的评测体系,让每次进化都可验证、不退化,沉淀为平台级自进化能力。演讲主要围绕大模型的自进化工程展开。主要针对三类自进化方向:
记忆(ReasoningBank/Mem0)
Skill 进化(SkillOpt/SkillEvolver/EmbodiSkill)
轨迹学习(in-context vs 自训练,API 时代只有前者)
其次会介绍在自进化之余,也要考虑到的防退化工程机制。防退化:四种机制(门控/有界编辑/审计/归因)
最后作为闭环,需要提及风险以及各类工程实践的负收益影响,以及我们是如何进行评估与工程实验。
听众收益:
1. 了解LLM Agent在自进化方向有哪些工程实践可以落地
2. 在工程实践中会遇到哪些坑,可以如何克服
3. 清楚认知到自进化这个领域的边界,有哪些不足之处
顺丰供应链Agent落地实践:供应链AI从工具走向全域智能操作系统
顺丰供应链覆盖仓储、运输、分拣等复杂业务场景,传统系统架构无法适配多角色协同、跨域数据融合及实时决策的业务需求。目前供应链行业AI应用普遍停留在对话式助手的浅层阶段,难以深度落地业务、创造实际价值。针对行业共性落地痛点,顺丰自研 FZ AgentOS 系统,依托本体论语义中心、企业级安全智能体框架、全流程AI自动化三大核心能力,探索传统供应链软件Agent化改造路径,实现供应链智能化从单一AI工具向全域AI操作系统的升级跃迁。
演讲提纲:
业务背景与痛点:仓储、运输、分拣等场景中,多角色协同难、跨域数据融合难、实时决策难
方案选型与落地挑战:为何选择大模型Agent技术;核心挑战是如何将AI能力“嵌入”业务流程,而非仅停留在对话式助手
解决思路:FZ AgentOS 整体架构:概览三大核心引擎如何协同解决痛点
核心技术一:FZ Ontology Engine:如何基于本体论实现业务概念结构化表达与跨系统互通
核心技术二:FZ Agent Studio:企业级安全特性如何保障智能体框架的可控执行
核心技术三:FZ Evolver:如何实现从业务需求到算法模型的全流程AI自动化
落地实践与成效:传统供应链软件的Agent化改造路径与初步成效
未来规划与总结:展望从“AI工具”到“AI操作系统”的演进方向
听众收益:
- 理解供应链场景中Agent落地面临的真实痛点(多角色协同、跨域数据融合、实时决策),避免走“对话式助手”的弯路。
- 学习一套从业务语义层(本体论)到安全执行层(企业级框架),再到模型自动化层(AI Evolver) 的完整Agent架构设计思路。
- 获取对传统供应链软件进行Agent化改造的可行路径与初步经验。
本体作为工业 Agent 的“语义罗盘”——COSMO-Claw 多智能体协同的可信落地实践
工业 Agent 从 Demo 走向产线,最大瓶颈不在模型能力,而在“语义漂移”:LLM 不懂工艺术语、跨智能体协同上下文丢失、知识库随版本“沉默腐烂”。本演讲分享工业互联网场景下“本体 × 大模型 × 多智能体”三主线的可信落地实践:本体是工业 Agent 的“语义罗盘”,引导 RAG 检索、约束 LLM 输出、提供多智能体共享语义。报告围绕 COSMO-Claw 平台介绍协同框架(任务调度、智能体编排、记忆与技能复用),分享本体增强 RAG 对幻觉抑制的方向性观察,并以电子制造与能源样板场景呈现从行业本体到产线可信 Agent 的工程演进,提炼“本体 × Agent”质量保障方法论。
演讲提纲:
一、业务背景:从 Demo 到产线,工业 Agent 卡在哪里
1) 工业互联网与大规模个性化定制,催生制造业 AI 原生 Agent 需求
2) 核心瓶颈是“语义漂移”而非模型能力:LLM 不懂工艺术语、跨智能体协同上下文丢失、知识库随版本“沉默腐烂”
二、方案选型:“本体 × 大模型 × 多智能体”三主线
1) 三条主线的定位与分工
2) 本体角色再定义:从知识图谱骨架到工业 Agent 的“语义罗盘”——引导 RAG 检索、约束 LLM 输出边界、提供多智能体共享语义
3) 选型对比:纯 LLM / 纯知识图谱 / 本体增强方案
三、落地挑战与解决思路:COSMO-Claw 多智能体协同平台
1) 协同框架整体设计:任务调度、智能体编排、记忆与技能复用
2) 本体增强 RAG 对工业问答幻觉抑制的方向性观察
3) 工程化难点:本体构建成本、版本治理、产线实时性
四、样板场景:行业本体 → 产线可信 Agent 的工程演进
1) 电子制造场景
2) 能源行业场景
3) 演进路径:行业本体顶层框架 → 场景适配 → 产线可信 Agent
五、未来规划
1) 标准化:IEEE P3927 / P3945 工业具身智能与 AI Agent
2) 规模化复制与生态共建
六、总结:提炼面向制造业 AI 原生 Agent 落地的“本体 × Agent”质量保障方法论
听众收益点:
1. 看清工业 Agent 落地的真正瓶颈——“语义漂移”的三种典型表现与成因,避免在“堆模型”上走弯路;
2. 掌握“本体 × 大模型 × 多智能体”协同架构,理解本体作为“语义罗盘”如何引导 RAG、约束 LLM 输出、支撑多智能体共享语义;
3. 获得从行业本体到产线可信 Agent 的工程演进路径与“本体 × Agent”质量保障方法论,可迁移至电子制造、能源等自有场景。
通义多模态、多端GUI智能体Mobile-Agent应用实践
大模型时代智能文档Benchmark落地实践
文档智能是企业智能化的基石,其能力水平直接决定了知识管理、业务自动化、智能问答、风险识别及辅助决策等上层应用的效果。由于企业文档来源复杂、版式多样、内容结构差异显著,单一维度或单一场景的测试方式难以真实反映系统在实际生产环境中的表现。因此,在评测集设计过程中,我们坚持全域,全任务覆盖、分层建模、贴近业务的总体原则,构建面向真实企业场景的文档智能评测体系。
演讲提纲:
1:文档智能Benchmark设计思路(沉淀企业域高价值文档,建立统一数据与指标规范,打造标准化自动化的统一评测平台,发布具有行业认可度的权威开源文档智能评测基准)
2:文档智能Benchmark构建方式(数据采集、难度分层、文档合成)
3:文档智能Benchmark案例
a: UNIKIE-BENCH,开放域文档信息抽取Benchmark
b: MMM-BENCH,多模态多层级细粒度文档分类Benchmark
c: CC-OCR-V2,聚焦企业困难样本和边缘案例的文档智能综合能力评测Benchmark
4:未来规划和总结
听众收益:
1. 对智能文档任务在企业工作流中的真实应用链路和目前的难点问题有一个全面的了解
2. 了解构建文档Benchmark的设计原则和文档数据链路构建流程
3. 我们已公开的3个Benchmark(UNIKIE-BENCH、MMM-BENCH、CC-OCR-V2)的实践经验
AI评测驱动系统自迭代—1688 Agent自动化评测实践
与传统功能开发结果的确定性不同,AI Agent 的输出充满不确定性,任何系统或环境变动都可能影响结果,评测的完备度与效率直接决定了 Agent 的迭代速度。本次分享将结合 1688 AI 应用(覆盖买家采购、商家经营等多场景,普遍存在多步骤、多分支的复杂长任务)的评测实践,介绍从"人工凭感觉"到"自动化可度量"的建设思路:如何把评测用例、执行环境、阅卷标准、归因逻辑和报告产物,组织成一套可运营的端到端评测能力,并通过多 Skill 组合的评测 Agent 实现自动阅卷、归因与报告生成,沉淀"评估准出标准"范式。和企业同行共同探讨评测体系如何支撑 AI 应用的持续迭代与自进化。
演讲提纲:
一、业务背景:AI 时代,为什么评测成了 Agent 迭代的瓶颈
二、评测体系:从"凭感觉"到"可度量"的标准沉淀
三、自动化评测平台 Data Forge:方案选型与核心设计
四、落地挑战与业务案例
五、未来规划:从评测工具到 AI 自进化底座
听众收益:
1. 理解 AI 时代评测的定位:理解"评测效率决定迭代速度",以及如何为多步骤、多分支的复杂长任务设计评测标准
2. 获得一套自动化评测平台的架构思路:"日志数据获取 + 多 Skill 组合评测 Agent + 结构化归因报告"的方案,理解如何实现从用例下发、自动执行到阅卷归因的全链路无人值守
从 Demo 到 Production:高确定商业场景下的Agent实践
运满满司机助理并不是一个简单的 Chat Agent,而是一个需要长期运行、持续感知环境、动态决策并最终影响真实成交的 Production Agent 系统。在真实物流场景中,Agent 不仅要处理司机对话,还需要持续感知司机行为、货源变化、市场行情与履约状态,并围绕司机长期收益目标进行连续决策。
本次分享将结合满帮司机助理的 Agentic 化实践,重点介绍如何将复杂业务系统逐步重构为长期运行 Agent:包括 Skill/CLI 体系设计、AGUI 接口改造、Event-Driven 感知体系、长期状态管理、Human-in-the-Loop 渐进式自治,以及 Agent 评测与仿真体系建设。同时也会分享在高确定性商业场景下,Workflow 与 Agent 如何共存,以及成本压力下模型与 Agent 框架的协同优化实践。
演讲提纲:
1. 从业务系统到 Agentic System:物流司机助理的 Agent 化演进
物流找货场景的核心问题
为什么 Chat Agent 无法直接解决真实业务问题
从 Workflow 系统到长期运行 Agent 的演进路径
高确定性商业场景对 Agent 的特殊要求
2. Skill/CLI 体系设计:Workflow 与 Agent 如何共存
AGUI 与接口 Agent 化改造:让 Agent 真正“看见”业务系统
Event-Driven 感知体系:长期运行 Agent 的眼睛与耳朵
Human-in-the-Loop 与高确定性自治体系
Agent 评测与仿真体系建设
成本压力下的软硬件协同优化
3. 总结与未来规划
Agent 从 Chatbot 向经营型智能体演进
更强的长期规划与自主经营能力
多 Agent 协同与世界状态建模
Agentic System 的下一阶段
听众收益:
1、理解真实业务系统如何逐步完成 Agentic 化改造,包括 Skill 抽象、事件驱动感知、长期状态管理与渐进式自治等关键工程实践;
2、掌握 Production Agent 的核心系统设计思路,包括 Workflow 与 Agent 共存、AGUI 接口改造、Human-in-the-Loop 与长程任务管理等经验;
3、了解真实商业场景下 Agent 的评测、仿真与成本优化体系,以及长期运行 Agent 在高确定性场景中的落地挑战。
机器人开发进入 Agent 时代:Moss 如何重塑研发流程
机器人开发正在进入 Agent 时代。过去,一个机器人创意从想法到真机运行,往往需要经历需求拆解、方案设计、代码实现、环境配置、设备连接、部署验证和反复调试等多个复杂环节,这让机器人研发长期依赖少数具备综合工程经验的开发者。
本次演讲将围绕《机器人开发进入 Agent 时代:Moss 如何重塑研发流程》展开,从几个典型研发场景切入,介绍 Moss 如何参与机器人创新的全过程:在创意阶段,Moss 帮助开发者把模糊想法转化为可执行的机器人任务;在软件实现阶段,Moss 协助理解工程、生成代码、调用接口并连接开发工具链;在方案验证阶段,Moss 参与真机部署、日志分析、问题定位与迭代修改;在新手入门阶段,Moss 通过自然语言交互降低机器人开发门槛,让不懂机器人系统的小白也能逐步参与研发。
Moss 的价值不只是提升编码效率,而是让机器人研发从“人手动串联工具和经验”转向“Agent 理解目标、协同工具、连接设备、推动任务闭环”的新范式。它让创意更容易落地,让开发过程更连续,也让更多人有机会参与机器人应用创新。
演讲提纲:
一、机器人开发为什么需要 Agent
机器人开发不是单纯写代码它同时涉及想法定义、软硬件理解、模型算法、系统环境、设备连接和真机调试
很多创意不是没有价值,而是卡在“不会实现”和“跑不起来”
传统机器人研发的痛点想法难以转化为清晰需求
软件实现依赖复杂工程经验
真机验证链路长、调试成本高
新手很难跨过机器人开发门槛
引出 MossMoss 不是一个简单的代码助手
它更像是面向机器人研发流程的 Agent 伙伴
它参与的是从创意、实现、验证到迭代的完整闭环
二、场景一:Moss 参与机器人创意想法
创意阶段的核心问题用户往往只有一个模糊想法
不知道这个想法是否可行
不知道需要哪些传感器、模型、算法和执行逻辑
Moss 的参与方式帮助用户澄清目标
将自然语言想法拆解为机器人任务
给出功能模块、实现路径和所需资源
帮助判断方案复杂度和可行性
示例表达用户说:“我想做一个能识别人、跟随人并语音互动的小车”
Moss 可以拆解出视觉感知、目标跟踪、运动控制、语音交互、设备部署等任务
让一个想法从“灵感”变成“研发计划”
这一阶段的价值降低创意转化门槛
让非专业用户也能把想法描述清楚
让开发者更快进入可执行状态
三、场景二:Moss 加入软件实现
软件实现阶段的核心问题工程结构复杂
接口、依赖、配置分散
开发者需要频繁查文档、改代码、调环境
Moss 的参与方式理解项目结构和已有代码
根据目标定位相关模块
生成或修改代码
调用已有 SDK、示例、模型和工具
辅助完成配置、脚本和部署文件
Moss 与普通代码助手的区别普通代码助手关注“写一段代码”
Moss 更关注“这段代码如何在机器人系统里运行”
它需要理解设备、环境、工程边界和运行链路
这一阶段的价值减少重复开发
降低工程理解成本
提升从需求到可运行程序的效率
四、场景三:Moss 进行方案验证和修改
验证阶段的核心问题机器人开发必须回到真实设备上验证
代码能跑不代表机器人能稳定运行
问题可能来自网络、权限、依赖、模型、接口、性能或硬件状态
Moss 的参与方式连接开发环境和板端设备
协助部署程序到真机
执行运行命令并查看状态
收集日志、分析报错
根据验证结果提出修改建议
继续调整代码和配置,形成迭代闭环
示例表达程序部署后无法识别摄像头
Moss 可以引导检查设备节点、驱动状态、权限配置、依赖安装和日志输出
不只是告诉用户“报错了”,而是推动问题一步步收敛
这一阶段的价值缩短调试时间
降低真机验证门槛
让研发从“写完代码”走向“真实运行”
五、场景四:Moss 让不懂机器人的小白参与研发
小白用户面临的问题不懂机器人系统架构
不理解开发板、模型、传感器、终端、部署之间的关系
容易在环境配置和报错中放弃
Moss 的参与方式用自然语言解释机器人开发流程
把复杂术语翻译成可理解的任务
通过分步引导帮助用户完成环境配置、示例运行和设备连接
根据用户当前状态给出下一步操作
让用户边做边理解,而不是先学完所有知识再开始
小白参与研发的变化从“我不会机器人开发”变成“我可以描述目标,让 Moss 带我完成”
从“看不懂文档”变成“让 Moss 帮我解释和执行”
从“遇到报错就停住”变成“和 Moss 一起定位问题”
这一阶段的价值扩大机器人开发人群
降低学习曲线
让创客、学生、产品经理、算法工程师都能更容易参与机器人应用开发
六、总结:Moss 重塑机器人研发流程
Moss 的核心价值不是单点提效不是只帮用户写代码
不是只回答问题和做设备管理
Moss 的真正价值是贯穿研发闭环创意想法:把想法变成任务
软件实现:把任务变成代码和工程
方案验证:把工程跑到真实设备上
持续修改:根据结果不断优化
新手引导:让更多人参与机器人开发
结尾观点机器人开发进入 Agent 时代后,开发者不再只是面对工具、文档和命令行
开发者可以从目标出发,让 Agent 协同工具、理解设备、推进任务
Moss 的目标,是让机器人创意更快变成真实可运行的应用
听众收益:
理解机器人开发为什么正在进入 Agent 时代
听众将看到,机器人开发的难点已经不只是写代码,而是如何把创意、软件、硬件、模型、部署和调试串联起来。Agent 的价值,正是在于帮助开发者打通这些复杂环节。
建立对 Moss 的清晰认知
听众将理解 Moss 不只是一个 AI 编程助手,而是面向机器人研发流程的 Agent 伙伴。它可以参与创意拆解、工程实现、设备连接、方案验证、问题定位和持续修改。
掌握一种新的机器人研发流程
听众将了解如何从一个自然语言想法出发,借助 Moss 逐步完成需求澄清、任务拆解、代码实现、真机部署和结果验证,把机器人开发从“靠经验摸索”变成“有步骤推进”。
看到不同角色如何参与机器人创新
对专业开发者来说,Moss 可以提升工程理解、开发和调试效率;对机器人小白来说,Moss 可以降低入门门槛,让不会机器人系统的人也能从描述想法开始参与研发。
获得可落地的场景启发
听众将通过典型案例看到 Moss 在机器人创意验证、应用开发、设备调试、新手教学等场景中的实际作用,并思考如何把 Agent 引入自己的机器人项目或开发流程中。
形成对未来机器人开发平台的判断
听众将认识到,未来机器人开发平台不再只是工具、文档和命令行的集合,而会逐步演进为由 Agent 驱动的智能工作台。开发者的工作方式也将从“操作工具”转向“定义目标、协同 Agent、验证结果”。
荣耀 YOYO 智能体的应用实践
YOYO 助理聚焦跨端数据协同,打破设备孤岛构建全局上下文,实现复杂任务全链路闭环。工程上打造多模态感知、个性化推理、主动服务、隐私安全与类自动驾驶意图执行五大核心能力。
演讲提纲:
一:智能体是AI 时代的“新桥梁”
架构总览:“端(感知)- 脑(调度)- 服(执行)”三位一体模型
二:核心实践:跨端协同与生态共创
- 跨端数据协同方案:打破设备孤岛,构建全局上下文
- 场景案例:YOYO 助理如何闭环用户要执行的任务
三:工程实践:五大核心能力
- 多模态感知(看懂/听懂/感知)
- 个性化学习推理(越用越懂你)
- 主动服务(服务找人)
- 隐私安全(数据不出端)
- 类自动驾驶意图执行(复杂任务自动拆解)
四:未来展望与生态开放
- 消费级 Agent 的下一个进化方向
- 开放 YOYO 智能体平台,支持第三方开发者接入
听众收益:
1. 深入理解荣耀 AI 智能体“端 - 脑-服”三位一体的系统级架构设计思路。
2. 了解荣耀如何通过“自研打底 + 行业共创”构建开放智能体生态的策略。
3. 多模态感知、意图路由、隐私安全等 AI Agent 核心技术的发展趋势与落地路径。
能共情的多面手:货拉拉AI客服数字人升级
客服作为企业连接用户的核心触点,长期面临场景覆盖广、诉求细碎繁杂、进线用户携带负面情绪等痛点。传统AI客服机械应答的模式难以适配复杂需求,导致大量进线咨询最终流转至人工,既推高了运营成本,也降低了用户服务体验。
随着大模型与Agent技术的成熟,AI客服的能力边界迎来突破性拓展。本次升级围绕货拉拉业务特性,从底层痛点拆解、全链路方案设计到落地效果验证,系统性迭代了智能路由、场景化应答改写、情绪感知安抚等核心能力,打造出兼具专业度与温度的新一代客服数字人,实现在线和热线服务体验与运营效率的双重提升。
演讲提纲:
一、货拉拉客服介绍
1. 货拉拉客服概览
2. AI客服痛点分析:
a. 场景多样(27个业务场景)且边界模糊,如何准确分发问题,从而提升回复的准确率
b. 进线人多带负面情绪,如何针对性安抚以便能顺利对话并解决问题
c. 问题本身繁杂,如何取舍设定回复的边界
3. AI客服数字人目标
a. 准确回复进线人的问题并安抚进线人情绪,以提升分流率和问题解决率
二、AI客服数字人方案及实践
1. 整体方案概览
a. 包含哪些部分:灵活的头脑、敏锐的耳目、严谨的口舌、敏捷的手脚、温暖的心及丰富的知识,共同刻画出一个能安抚情绪、能解决问题的AI客服数字人
i. 场景路由:头脑清晰的调度中枢;精准识别用户需求并高效分发任务,确保服务路径最优解
ii. Query改写:文思敏捷的语义引擎;深度解析用户Query并精准重构表达,提升交互容错性与准确性
iii. 舆情质检:耳聪目明的舆情侦探;实时捕捉舆情问题,及时反馈上报,控制舆情风险
iv. 红线过滤:敏感内容的安全卫士;识别与拦截高风险内容,严守合规底线,避免祸从口出
v. 多模态情绪感知与共情:温暖细心的贴心助理;融合语音、文本、表情多维度情感识别,实现人性化情绪回应
vi. Skill&MCP:技能多样的多面能手;无缝调用多领域能力模块,提供一站式场景化解决方案
vii. 知识挖掘:博闻强识的宝藏地图;快速、准确挖掘场景知识,满足数字人客服专业知识储备
2. 整体架构是什么
a. 文本:multi-agent方案,不同的模块即为一个agent,用户问题经过路由、改写与情绪识别后,通过中控Agent分发到具体的专家Agent进行问题解决,最终给到用户反馈
b. 热线:热线时效要求高,简单的multi-agent方案不再适用;因而使用快慢自考架构:
i. 快思考:基于上下文对话内容输出承接语,快速响应司机,且确保与上下文过度自然
ii. 慢思考:输出最终回复,准确处理司机问题
整体上既能确保用户体验流畅,又能准确处理用户问题,实现时效和回复效果的共赢
3. 各项自能力介绍
a. 路由模块/改写模块:如何通过模型精调实现准确分发与改写
b. 情绪安抚模块:如何设计情绪类型、情绪识别方案、情绪处理策略及情绪评估方案,最终实现情绪的识别与处理
c. 红线模块:什么是红线、如何通过多重限定机制确保AI不会输出红线内容
d. 知识挖掘模块:如何从零散的线上真实对话中提取出有用的知识库,并与当前已有的知识库合并,降低业务梳理知识所需的人力
e. ...
4. 客服落地效果展示:
a. 具体的效果指标与对话示例展示
三、总结和展望
1. 总结
2. 展望
听众收益:
1. 货运场景下的客服业务特点及痛点
2. 企业级AI客服数字人解决方案和落地效果
3. AI客服数字人各项子能力构建方案
AI代码逻辑炼金Agent:逆向萃取系统代码图谱到自动化迭代的研发效能实践
AI 代码业务逻辑“炼金师”,是平安寿险 IT 团队面向老旧系统升级迭代困境打造的深度技术创新型全链路自动化闭环平台,直击行业老旧系统代码积年老旧、文档缺失、逻辑黑盒、模块高度耦合、人工梳理成本极高、无法快速迭代重构的共性痛点,从根源解决老旧系统难以高效更新换代的行业难题。
项目具备硬核技术创新,深度融合AST 抽象语法树解析、微服务调用链 BFS 拓扑分析、代码知识图谱建模、多级代码分层智能裁剪技术,构建文件、类、方法、逻辑段四级最小完备上下文,精准规避大模型 Token 超限与推理幻觉;结合自研 AI 技能引擎与精细化提示词工程,实现百万级存量 Java 代码业务逻辑逆向自动萃取、架构与流程可视化自动生成、业务规则与 PRD 文档标准化自动产出,并基于萃取的业务规则一键自动代码编写与逻辑重构。
平台首创代码解析→逻辑萃取→知识沉淀→规范建模→自动代码编写→系统迭代端到端全流程自动化闭环,不再仅停留在代码解读梳理,而是以萃取固化的真实业务规则为基准,反向驱动新代码智能编写、模块重构与系统升级,打通从旧代码考古到新系统快速迭代的完整链路。
项目落地实现梳理效率提升 85%+、萃取准确率达 99.5%、设计绘图工时减少 80%、需求迭代周期缩短 50%,同时完成复杂代码解耦降维。后续将兼容多编程语言、自研行业专属代码大模型、工具产品化输出,为全行业老旧系统快速重构、平滑升级、持续迭代提供领先的 AI 技术解决方案。
演讲提纲:
一、项目背景:遗留系统存在百万级历史代码,文档缺失、迭代转手多,业务逻辑梳理难度大;市面 AI 大模型仅支持代码生成,缺乏历史代码逆向萃取能力,平安XX系统重构面临代码量大、人工梳理耗时久等五大痛点。
二、项目愿景:依托 AI 大模型打造炼丹炉,将代码考古转为智能萃取,实现业务逻辑还原、架构可视化、流程自动生成与知识资产沉淀。
三、技术方案:采用四步架构,通过 AST 解析、多层级代码裁剪、AI 技能解析、标准化工作流输出,攻克大模型 Token 限制难题。
四、项目成果:代码梳理效率提升 85%+,萃取成功率超 99.5%,大幅缩短需求分析与绘图时间,优化代码复杂度。
五、未来展望:拓展多语言适配、训练专属模型、产品化落地,延伸赋能代码智能重构。
听众收益:
1. 掌握一套基于“AST解析+代码知识图谱+AI技能引擎”的研发效能Agent落地架构
2. 获得“代码逆向萃取→自动化重构”闭环的量化提效路径与避坑指南
企业大规模AI Coding落地:如何控制大模型成本?
碧桂园服务已将大语言模型深度融入开发全流程(架构设计、需求编写、代码生成、自动化测试),但随着AI调用量激增,成本迅速失控,但研究发现其中60%以上为Token浪费(重复规范、盲目使用最贵模型、上下文膨胀等),研发团队启动成本治理专项,提出五层协同优化方案。经多个项目验证,月度成本降幅达88%。同时,团队革新敏捷项目管理模式,采用“多人协同写需求,少数人执掌AI编程”,研发效率再翻倍。
演讲提纲:
一、Token成本为何居高不下
- 浪费诊断:实测60%以上Token属无效消耗
- 三大病因:
- 重复规范注入
- 无差别使用最贵模型(简单任务也用大参数模型)
- 上下文过度膨胀(历史对话、无关文件被反复携带)
二、研发全链路Token优化体系
- 输入层:静态规范外部化 → 用检索替换重复文本
- 模型层:智能路由 → 简单任务切至轻量模型(如GPT-3.5/本地小模型)
- 上下文层:滑动窗口 + 摘要压缩 → 控制单次输入长度
- 输出层:限制最大生成Token + 结构化输出模板
- 工程层:缓存复用 → 相似请求命中缓存,避免重复计算
- 成果:月度成本降低88%
三、AI时代软件研发流程的创新改革
- 新协作模式:多人协同写需求 → 少数人执掌AI编程
- 关键动作:
- 需求结构化:用自然语言+示例拆解为AI可执行的原子任务
- 代码审核前置:AI生成代码由“执掌者”集中质检与集成
- 测试自动化:AI批量生成用例,人工只把关边界条件
- 效果:研发效率翻倍,总成本可控
听众收益:
从技术角度收获大模型Tokens节省的技术方案
从软件研发管理角度,收获一种新的软件研发模式
AI自主迭代修复驱动开发测试端到端闭环实践
日常研发里约34%快车道交付需求,存在研发流程割裂、开发测试重复劳作、缺乏端到端协同痛点。我们基于多智能体架构,依托AI-IDE落地方案。方案打通需求理解→设计生成→代码实现→部署验证→测试执行→问题修复全自动化闭环,实现开发与测试能力深度融合、打破组织业务边界。同时搭建基于测试反馈的智能迭代修复机制,通过子Agent拆分任务管控上下文负载,优选GLM-5、星云V8思考模型保障Skill遵循度,自动定位问题、循环修复迭代,大幅降低重复工作量,标准化提速快车道需求交付。
演讲提纲:
一、业务背景
1. 研发现状:快车道交付需求占比约34%,是日常研发高频场景
2. 现存痛点
- 流程割裂:需求、设计、开发、部署、测试各环节脱节,无端到端闭环
- 人力冗余:开发自测、测试系统测试,重复编写测试用例,工作量冗余
- 组织壁垒:开发、测试部门工作割裂,能力无法互通复用
3. 核心诉求:标准化、自动化、打通组织边界,实现快车道需求高效交付
二、方案选型
1. 选型定位:聚焦34%快车道需求专属解决方案,而非通用零散工具
2. 技术底座:采用多智能体架构,基于AI-IDE落地
3. 模型选型验证:GLM-5、星云V8思考模型可达理想效果,非思考模型Skill遵循度不足,已做优选落地
三、落地挑战
1. 流程挑战:全环节链路长,难以实现自动化串联闭环
2. 技术挑战:大模型存在上下文负载拐点,超40%后性能显著衰减
3. 协同挑战:开发、测试部门边界固化,能力难以融合
4. 机制挑战:测试失败后缺乏自动分析、迭代修复的闭环机制
四、解决思路
1. 流程层面:搭建需求理解→设计生成→代码实现→部署验证→测试执行→问题修复全流程自动化闭环
2. 架构层面:采用主Agent编排+子Agent独立分片执行,控制主Agent上下文占用30%-40%,规避性能衰减
3. 组织层面:实现开发与测试能力深度融合,打破部门组织边界,消解重复工作
4. 机制层面:建立基于测试反馈的智能迭代修复机制,自动定位根因、循环修复、重新部署复测
5. 规范层面:标准化SOP与Skill定义,保障模型执行遵循度
五、未来规划
1. 场景扩容:从34%快车道需求,逐步向常规研发需求延伸覆盖
2. 模型优化:持续迭代适配商用大模型,优化Skill遵循度与自愈能力
3. 推广落地:向团队全员开放Skill能力,形成标准化研发交付范式
六、总结
1. 聚焦34%核心快车道需求,直击研发重复劳作、流程割裂痛点
2. 依托多智能体架构,实现全流程自动化闭环+跨部门能力融合
3. 以子Agent上下文管控、测试智能修复两大亮点,解决技术与业务双重难题
4. 后续持续扩容场景、推广复用,打造AI驱动的标准化研发交付体系
听众收益:
1. 业务认知提升:了解团队34%快车道交付需求的真实研发痛点,看懂开发测试重复工作、流程割裂、组织壁垒等问题的根源,建立AI赋能研发的业务视角。
2. 技术经验收获:掌握多智能体子Agent拆分编排、上下文负载管控、商用模型选型(GLM-5/星云V8思考模型)等实战落地经验,可复用至自身AI研发场景。
3. 方案借鉴价值:学习端到端全流程自动化闭环、跨部门能力融合、测试反馈智能迭代修复的整套设计思路,可直接参考落地到本部门研发提效工作中。
企业AI-Native研发转型:构建人机协同新范式
当下AI编码能提升单个开发人员效率,却普遍出现项目延期的提效难题。主要原因是企业开发和个人开发场景不同、软件开发属于全链路系统工程、员工独立摸索的零散开发模式无法汇总整体效率。围绕质量管控、人机分工、组织知识沉淀三个方向制定改进方案,分试点、推广、固化三步落地,同步优化组织架构与考核标准。经过落地实践,人员、研发流程AI落地覆盖率大幅提升,项目交付周期明显缩短。
演讲提纲:
1. 现存问题:说明AI单兵提速但项目延期现象,从场景区别、系统工程属性、零散开发三点分析成因
2. 优化方案:从代码质量建设、人机分工协作、组织经验沉淀三个维度提出改进思路
3. 落地举措:按三阶段分步落地,划分不同业务落地标准,调整组织架构、岗位职责,配套多维度数据度量
4. 落地成果:展示人员覆盖、代码自动化生成、交付效率等实际落地数据
5. 总结展望:总结AI时代研发组织搭建经验,持续优化组织自我迭代能力
听众收益:
本议题聚焦企业 AI Native 研发转型,希望帮助参会者建立对下一代软件工程体系的系统性认知,并获得可落地的实践经验与行业洞察。参会者将能够系统了解 AI Coding 如何从个人效率工具演变为组织级研发能力,理解 AI Native 对软件工程、研发流程与团队协作方式带来的深层变化。
Agentic4Rec:理论、算法、大规模工业落地应用与挑战
理论层,梳理 Agentic Recommendation 所面对的三个根本性问题;推理监督信号的来源、协同信号的注入方式、以及训练目标与推理过程之间的一致性,并从信息论视角阐明该范式与传统推荐、生成式推荐之间的本质差异。
算法层,剖析当前主流技术路线,对代表工作进行结构化对比,明确其解题边界、相互依赖与未解难题。
工业落地层,分析 Agentic Recommendation 在大规模生产环境中所面临的延迟与成本、长尾分布、分布漂移等结构性约束,并给出当前条件下具备工程现实性的整体方案。
演讲提纲:
1、Agentic4Rec 范式的提出背景
2、Agentic4Rec 的范式定位与角色框架
3、理论层:推理监督、协同信号、训推一致性
4、算法层:主流技术路线、解题边界与代价权衡
5、应用层:大规模工业落地的结构性约束与可行方案
6、趋势判断与开放问题
听众收益:
1.理论层面:建立对该范式三个根本性问题的清晰理解——推理监督信号的来源差异、协同信号在大模型 Agent 中的注入方式、训练目标与推理过程之间的一致性问题。
2.算法层面:掌握当前主流技术路线的解题边界与相互依赖关系,理解算法设计的出发点、当前局限与未解问题,从而在工程或研究选型时具备结构化的判断依据。
3.应用层面:获得 Agentic Recommendation 在大规模生产环境中所面对的五项结构性约束的完整视图,以及当前条件下具备工程现实性的整体方案。
C2AI2X 协议与真机生态的统一技术架构
AI 对话产品面临一个结构性断层:LLM 输出的是自由语义,商业系统消费的是结构化意图与身份凭证。C2AI2X 协议的核心工程价值,正是填补这一真空——它定义了从自然语言对话到真实商业履约的标准翻译层与路由契约。
在真机生态的正式执行链路中,Brain-Core 负责语义推理与意图解析,Platform-Core 承担统一身份、计费、权益与审计中台职责,而 C2AI2X 作为两者之间的协议层,确保前端对话状态能够无损地转化为可路由、可计费、可闭环的商业事件。基于这一底座,真机已孕育出 ZhenMate(万能服务总入口)、ZhenMeta(真机元境)、ZhenMem(记忆资产)三大平台品牌,以及 ZhenIns(保险咨询)、ZhenHire(猎头服务)、ZhenRent(机器人租赁)、ZhenCap(融资顾问)、ZhenLegal(法律服务)、ZhenQuant(量化策略)六大垂直履约品牌。
本次演讲将剖析 C2AI2X 协议的断层起源,阐述 Brain-Core / Platform-Core / Frontend 三核协作架构,展示 Handoff 路由引擎的工程实现,并探讨该协议从自用底座向开放生态演进的路线。
演讲提纲:
1、AI 对话留存高但转化低的结构性断层,本质在于 LLM 自由语义与商业系统结构化输入之间缺乏标准协议层,导致垂直领域烟囱式重复建设意图解析、身份认证与计费结算。
2、C2AI2X 协议将 AI 从内容终点站重新定义为商业履约的第一跳路由器,通过意图形式化与跨域路由契约连接对话层与商业层,使 X 终端可独立演进为人工顾问、商品目录、交易支付、协作空间、履约交付或学习路径。
3、真机生态的三核协作架构严格遵循 Frontend → Platform-Core → Brain-Core 调用链路,C2AI2X 协议层衔接 Brain-Core 的语义推理输出与 Platform-Core 的统一身份、双轨计费及权益审计中台。
4、单文档驱动系统实现新品牌 48 小时零代码部署,智能路由引擎通过意图识别、画像推断与服务匹配三阶段将 Handoff 决策延迟压缩至 200ms 以内,Cookie-only 跨域身份与结构化 Consent 机制保障多品牌共享底座时的数据隔离与合规。
5、ZhenMate、ZhenMeta、ZhenMem 三大平台入口与 ZhenIns、ZhenHire、ZhenRent、ZhenCap、ZhenLegal、ZhenQuant 六大垂直品牌共享同一底座,实现 164 处硬编码行业词归零、14 个站点模板支撑、端到端 Handoff 延迟低于 2 秒。
6、C2AI2X 将对外开放意图摄入、智能分诊与交接履约标准接口,Brain-Core Agent 将直连 Platform-Core 缩短对话到履约的路径,真机生态的终极定位是 AI 服务经济时代的商业路由基础设施。
听众收益点:
1. 掌握 C2AI2X 协议化架构设计,理解如何用统一协议层替代垂直烟囱;
2. 厘清 Brain-Core / Platform-Core 的协作边界与风控约束,规避前端直连推理层的架构陷阱;
3. 获得可落地的单文档驱动系统设计方法论,实现新品牌 48 小时零硬编码部署;
4. 理解 AI 首层获客与 Handoff 路由的工程实现,降低专业服务初筛成本;
5. 明确从自研底座到开放协议的演进路径,把握 AI 商业路由基础设施的建设方向。
下一代 Agent 形态探索:从打破数字世界信息孤岛,到突破物理世界感知屏障
业务背景:随着 Agentic AI 技术快速成熟,用户对智能体的需求已从传统对话问答,转向跨设备、跨社交场景的全自动任务执行与协作。当下智能体普遍被困在单一设备、孤立应用与封闭社交空间中,设备割裂、社交协作分散、数据与能力无法互通,形成了数字世界里设备与社交双重信息孤岛,难以适配真实的数字生活与协作场景。
在解决数字世界协同问题的基础上,用户进一步需要智能体走出屏幕、感知真实物理环境,实现更贴合生活的主动交互与服务。基于此,我们开展了下一代 Agent 的形态探索,从打破数字世界的信息孤岛,到突破物理世界的感知屏障,推动智能体从数字空间执行者,向全场景智能助理升级。
方案选型:跨设备、跨用户协同 Agent 系统、物理世界实时视觉理解、长时多模态记忆
落地挑战:
1. 数字世界:手机、电脑等设备割裂,信息与执行无法互通,形成孤岛
2. 物理世界:Agent 无法感知真实环境,缺少主动交互与长期记忆能力
解决思路:
1. 针对数字世界信息孤岛问题:构建多设备协同架构,打通设备、应用、社交场景的执行壁垒
2. 针对数字世界到物理的感知屏障:加入实时视觉感知与多模态记忆,让 Agent 看懂真实世界、主动服务
演讲提纲:
1. 行业趋势:Agent 从单设备对话,向数字全域执行、物理世界感知升级
2. TopoClaw:打破数字孤岛 —— 多设备跨用户协同,打通数字世界执行壁垒
3. Venom:突破物理屏障 —— 实景感知 + 长时记忆,让 Agent 走进真实世界
4. 核心技术方案:数字协同与物理感知的工程化落地
5. 实现效果:跨设备执行、物理感知服务的demo演示
6. 未来展望:下一代全场景 Agent 的形态与发展方向
听众收益:
1. 清晰掌握 Agent从数字到物理的演进路径
2. 了解打破数字信息孤岛、实现多设备协同的落地方案
3. 了解物理世界感知与主动服务的 Agent 实现方法
一个人,五个 Agent:把功能开发产品化的端到端探索
个人开发者用 Claude Code 已经能搞定"一次工具调用、一次 commit"级别的任务,但完整 feature 开发(澄清 → PRD → 技术设计 → 实现 → 验证 → 发布)仍要手动跑 7~8 步流程,重复且容易掉环节。agent-team 把这个流程产品化为一句话启动的 CLI:agent-team
演讲提纲:
1. 业务背景:个人开发者的"流程税"
1.1 Claude Code 解决了"一次工具调用",但 feature 流程仍要手动跑 7 步
1.2 目标:一句话 → 5 角色协作 → 可审 PR;HITL 门锁兜底,不放任 agent 自走
2. 方案选型:从多进程 worker 收敛到单进程 + AgentDefinition
2.1 v1 初稿:driver + 4 worker 子进程 + 文件 IPC(直觉方案)
2.2 读 SDK 源码后的颠覆性发现:agents dict / Agent 工具 / can_use_tool /
sandbox / session_store / max_budget_usd 全是 SDK 原语
2.3 决策:单进程 + AgentDefinition dict,估省 50% 工作量
2.4 普适教训:上 SDK/框架前先盘 SDK 已有原语,不要先动手
3. 落地挑战:四个真实踩坑
3.1 承重假设不能读源码"看着就行" —— 必须真跑 spike
三条假设(can_use_tool subagent / MCP 阻塞 stdin / resume 完整恢复)
全部 PASS 才进 plan,$0.7 / 30min 兜底
3.2 FakeMessage 测试翻车:171 测试全绿,真 SDK message 没 .kind 属性,
dispatch 全掉 else 哑路 —— streaming text 静默、cost 永远 0
3.3 HITL 不能用 permission callback 弹菜单(async 60s 超时 + 语义不符)
→ 改成 CEO 主动调的自定义 MCP 工具
3.4 Read/Glob/Grep 自动放行:forbidden_paths 阻 .env 失效,
逼出 4 层防御(disallowedTools 路径 + PreToolUse hook +
can_use_tool + sandbox)
4. 解决思路:4 个能复用的工程模式
4.1 spike-first:先验证再 plan,把 ROI 最低的"重写 spec"挡在前面
4.2 SDK 原生优先:budget / session / sandbox / permission 全走原语
4.3 state.json 单一事实源 + update_state MCP 工具(worker 不许直 Write)
4.4 workspace 与 worktree 分离:PR diff 干净,agent 产物 gitignore
5. 解决成效
5.1 首次 real-LLM E2E:9 min / $2.71 / 5 delegations 全过 / 3 门锁全 approved
5.2 237 单测 / 93.36% 覆盖 / 4 个 milestone tag
5.3 2278 行核心代码(SDK 原生路径 vs 自造工程的 50% 节省落地)
6. 未来规划
6.1 v2 amendment list 33 条(已盘点)
6.2 Docker 化(等 Anthropic 容器化路标)
6.3 --auto-pr / 跨 feature lessons sink / multi-feature 并行
7. 总结:单人指挥多 Agent 的三条真心话
听众收益:
1. 拿到一份"用 SDK 原语换工程量"的决策清单 —— 上 Claude Agent SDK 之前能省下哪些自造的轮子(budget / sandbox / session_store / can_use_tool / permission_prompt_tool_name),听完就能直接对照自己的方案删 50% 设计。
2. 看懂"承重假设漏验证"的翻车现场 —— 171 个测试全绿但生产全废的全过程复盘,以及为什么"读源码看到了"不等于"实测过",避免在自己项目里重蹈覆辙。
3. 得到一套单人指挥多 Agent 的实操参照 —— 5 角色分工、3 个 HITL 门锁、4 层权限防御、state.json 单一事实源,以及一次完整 feature 开发的真实经济性数据(9min / $2.71)。
小米 Data Agent Harness 落地实践
小米团队在 BIRD 全球 Text2SQL 评测中斩获第三,但更重要的问题是:如何让这个能力在真实业务中持续变准、越用越好?我们的答案是:把 BI 平台多年积累的语义层变成 AI 持续进化的燃料——低成本构建领域评测集,驱动效果闭环迭代,并基于已验证的评测集同步提升准确率与响应效率。今年我们进一步开放 CLI 能力,让用户通过自然语言完成知识沉淀与效果迭代。本次分享还原这条路径的核心取舍,为行业Data Agent 落地提供参考。
演讲大纲:
一、背景:从 Text2SQL 到 Data Agent
1. 去年成效回顾与今年的新命题
2. BIRD 全球第三之后,真正的挑战在哪里
二、让 BI 积累成为 AI 进化的燃料
1. 人工构建评测集:成本高、与真实场景脱节
2. 依托 BI 语义层,低成本构建领域专属评测集
三、迭代闭环:把调优工作交给 AI 自己做
1. 以前靠人分析调优,现在 harness 全程交给 Claude Code 接管
2. 自动完成:评测 → 发现问题 → 修复 → 再评测
四、CLI 对外:用户反馈驱动知识自动沉淀
1. 用户自然语言分析、反馈,自动沉淀知识
2. 基于已验证评测集命中复用,准确率与响应效率同步提升
五、效果与展望
本体驱动企业Agent决策的探索与思考
当前企业级AI正面临"60%落地瓶颈":智能体能背诵业务手册,却无法准确、可靠、可解释的执行实际业务动作。本演讲深入探讨如何以本体(Ontology)为核心,构建企业级"数据上下文层",支撑数据驱动的企业级Agent精准决策,帮助智能体从原型演示,走向实际生产的价值鸿沟。
演讲提纲:
一、引言:企业AI落地的现实困境
1. DataAgent(如NL2SQL)的落地难点:语义歧义、复杂业务逻辑理解失效
2. 企业Agent决策准确性不足:幻觉问题、动作不可控
3. 可解释性痛点:黑盒决策难以通过合规与风控审查
二、核心概念:本体——Agent的“企业大脑”
1. 本体的定义与本质:概念、属性、关系、约束的形式化表达
2. 从本体到数据上下文的转化路径:本体 → 语义标注 → 知识图谱 → 上下文向量化
三、企业本体平台建设与落地
1. 企业本体平台的建设思路
- 分层架构:基础本体层(通用概念)+ 领域本体层(业务专有概念)+ 实例层(企业数据映射)
- 技术选型:OWL/SHACL vs 轻量级JSON-LD + 图数据库(Neo4j、NebulaGraph)
- 本体建模工具:Protégé、OntoStudio、企业自研低代码本体编辑器(支持自然语言辅助建模)
- 本体与LLM的结合:利用大模型半自动化抽取实体关系,人工校验形成种子本体
2. 企业本体的落地实施方法
- 两阶段映射:
- 本体到数据库Schema的映射(使用R2RML、Ontop等映射语言)
- 本体到API/事件流的映射(OpenAPI扩展语义标签)
- 推理引擎集成:
- 基于规则推理(SWRL、Drools)处理确定性逻辑
- 基于表示学习的推理(TransE、ComplEx)处理隐性关系
- Agent交互协议:
- 本体作为Function Calling的Schema约束,限制Agent动作空间
- 引入本体驱动的ReAct框架:Thought中使用本体概念,Action调用本体定义的原子能力
3. 企业本体的治理思想:如何避免语义漂移
- 语义漂移检测技术:
- 计算本体版本间的概念相似度(基于向量嵌入的JS散度)
- 监控Agent执行日志中未定义概念的比例
- 持续治理流程:
- 本体变更影响分析(依赖图谱 + 最小回溯重推理)
- 业务术语众包反馈 + LLM辅助术语对齐
- 组织保障:本体委员会(数据Owner + 业务专家 + AI工程师) + 自动化CI/CD for Ontology
四、应用实践:企业Agent + 本体的场景与效果
1. 典型应用场景
- 供应链决策Agent:本体描述供应商、物料、订单、约束规则 → Agent进行因果链故障定位与补货策略生成
- 营销活动优化Agent:本体封装用户标签、渠道、内容元数据 → Agent自主编排A/B测试并解释ROI归因
- 资产运营Agent:本体建模设备资产、维护记录、工况参数 → Agent执行预测性维护任务并生成可解释报告
2. 实际应用效果
- 准确性提升:本体约束后的Agent动作合法率达到99.5%(vs 无本体65%),减少无效调用
- 可解释性:基于本体路径的决策追踪,输出<概念, 关系, 置信度>三元组证据链,通过企业合规审计
- 推理效率:本体预推理生成物化视图,将Agent决策中在线图查询时延从秒级降至50ms以内
- 治理成本:本体变更后自动化回归测试,人工审核量减少70%
3. 技术难点与应对
- 难点1:本体建模工具及方法缺乏标准 → 采用混合建模(人工顶层设计 + LLM辅助补全),并开源内部建模规范草案
- 难点2:本体规划缺乏组织保障 → 设计“本体即代码”流水线,集成到现有DataOps流程中
- 难点3:本体存算引擎不成熟 → 基于LSM树的图索引 + 向量联合检索,支持本体推理与相似度查询混合负载
五、总结与展望
- 本体是Agent跨越“落地鸿沟”的必要基础设施
- 下一步:自适应本体演进、多模态本体、联邦本体
听众收益:
1- 企业级本体构建、运行和治理的实践和思考
2- 企业级本体驱动Agent决策体系的落地挑战及解题思路
面向企业智能办公Agent的本体驱动知识工程构建
企业知识资产规模庞大,但存储分散于多个独立系统,员工首次检索成功率不足40%,平均耗时30分钟以上。多个AI需求场景分析显示,39.5%与智能检索相关、23.5%与合规审查相关,17.3%与文档分类整理相关,其本质均是知识底座缺失。
我们提出企业AI三层架构,基于本体论构建领域知识图谱,采用"LLM+本体约束"双引擎协同策略:核心知识以本体+规则保障准确率>85%,一般知识以LLM+本体约束达80-85%。在文档结构化场景中实现检索时间减少、提升报告编写效率;在工单生成场景中基于GraphRAG混合检索,召回准确率提升15-20%。LLM辅助本体构建降低人力成本约30%,大大提升了Ai在企业智能办公场景应用能力。
演讲提纲:
一、背景:知识困境
海量知识分散、检索难、利用率低
专家退休,经验传承不可持续
AI需求背后:底层知识组织方式决定AI上限
二、方案:技术架构
企业AI三层架构:入口层、中间件层、知识图谱本体层
本体设计:五类本体 + 五种核心关系
LLM+本体融合:互补而非替代
GraphRAG混合检索:多路召回,提升准确率
三、落地应用实践
文档结构化:解析→入库→治理→生成闭环,双引擎协同
智能工单生成:设备识别→手册匹配→多源检索→可信校验
智能会议纪要:语音识别,声纹识别,关联约束、记忆约束、知识增强、纪要生成
四、总结
本体+LLM可行路径
以终为始,小步快跑
听众收益:
1- 掌握一套可落地的"LLM+本体"知识工程方法论
理解纯RAG在专业领域的局限,以及如何通过本体论为AI构建"领域语法规则"。掌握"核心知识本体+规则(>95%)/ 一般知识LLM+本体约束(80-85%)/ 辅助知识LLM自由生成(>70%)"的三级分层策略,以及知识图谱GraphRAG混合检索(向量+关键词+知识图谱路径)的实际部署经验,避免知识工程建设中的常见坑。
2- 获得企业AI能力的战略定位与竞争壁垒构建思路
通过"入口层-中间件层-知识图谱本体层"三层架构分析,理解为什么知识底座的构建质量决定了AI应用的天花板,以及如何通过本体知识图谱构建核心竞争壁垒,摆脱应用层同质化竞争。
看见、记住、行动:多模态 Agent 的记忆工程实践——从流式视频伴随到端侧具身智能体
Agentic AI 走向"持续在线的多模态助手",记忆正成为决定系统上限的核心瓶颈。本次分享基于两个真实落地:自 3 月起服务千万级用户的小布伴随,以及在社区受到关注的开源端侧 Agent X-OmniClaw。前者以"短期 Buffer + 长期 mem"双层流式记忆为骨架,破解屏幕高噪与写入延迟,已支撑千万级用户的跨片段连贯问答稳定上线;后者面向端侧算力与隐私边界,把感知与行为持续沉淀为可审计、可复用的端侧记忆,闭环出"记得住、用得上、主动出手"的个性化体验。
最后我们一起展望:当记忆从一次性的会话上下文进化为持续生长、可被复用的系统级基础设施时,记忆驱动的 Agent OS 会带来怎样的可能。
演讲提纲:
1. 记忆,Agent 的下一个胜负手
-从 Prompt 到 Memory
-持续在线 vs 端侧具身
-记忆工程的设计契约
2. 边看边答:小布伴随的流式记忆
-场景:让 Agent 陪你使用手机
-一短一长,双层流式记忆
-剥掉噪音,沉淀事件
-落地之外,再走一步
3. 装进口袋的 Agent:X-OmniClaw 的端侧记忆
-把手机变成感知枢纽
-端侧的"长短时海马体"
-从动作到技能的沉淀
-让 Agent 学会主动出手
4. 展望:下一站,Agent OS
听众收益点:
1. 全面了解OPPO在千万级用户上验证过的多模态流式记忆工程设计
2. 端侧 Agent 记忆的开源设计
从“完成任务”到“持续进化”: AI Agent 记忆能⼒的评测与实践
随着 AI Agent 加速进⼊企业级应⽤,智能体正在从“完成单次任务”⾛向“⻓期服务业务”。在真实业务场景中,Agent不仅需要回答问题和调⽤⼯具,还需要记住历史、理解变化、跟踪状态,并在持续交互中沉淀知识与复⽤经验。
围绕这⼀趋势,Agent Memory ⽅法正在快速发展,推动着智能体从“被动获取信息”⾛向“持续积累知识、更新状态、复⽤经验”的⾃演化阶段。但当前⽅案众多,评测⼝径并不统⼀,缺少能够横向⽐较不同记忆能⼒的数据集与测试⽅法。因此,如何判断⼀个 Agent 是否真正具备⾃演化记忆能⼒,什么样的记忆⽅案适合什么任务,已经成为 Agent Memory 从概念探索⾛向⼯程化落地的重要问题。
本分享将介绍 EvoMemBench,⼀个⾯向 AI Agent ⾃演化记忆能⼒的统⼀评测基准。我们将从⾏业背景、⽅案演进、评测缺⼝、Benchmark 设计和企业落地实践等⻆度,探讨如何让 Agent 从⼀次性执⾏⼯具,⾛向能够持续积累知识、复⽤经验并不断进化的智能系统。
演讲提纲:
1. AI Agent 正在从“单次执⾏”⾛向“⻓期服务”
2. ⻓上下⽂与 RAG 仍难⽀撑 Agent 持续进化
3. Agent 如何在交互中沉淀知识、 更新状态与复⽤经验
4. EvoMemBench: 如何系统评测 Agent 的⾃演化记忆能⼒
5. 从记忆评测⾛向持续进化的企业级 Agent Memory 基础设施
听众收益:
1. 理解 AI Agent 为什么正在从“单次执⾏”⾛向“持续进化”, 以及记忆能⼒在企业落地中的关键价值。
2. 了解当前 Agent Memory ⽅案快速发展但缺少统⼀评测标准的⾏业现状。
3. 掌握 EvoMemBench 如何评测 Agent 的⾃演化记忆能⼒, 并获得企业级 Agent Memory 建设的实践启发。
狍子AI的记忆工程与知识工程 — 有记忆、有知识、会进化的 AI 伙伴
随着 AI 助手在企业场景的深入,传统无状态 AI 的局限性日益凸显——每次对话从零开始,上下文丢失,团队协作效率低下。
狍子AI项目调研了知识增强、多 Agent 等多种方案,最终选择「记忆工程 + 知识工程」双轨并行的架构。落地过程中的核心难点在于:记忆的动态生命周期管理、知识自我进化的评判标准,以及如何在有限上下文中高效注入记忆。
我们通过六层记忆服务体系(隐式提取→显式保存→截断保护→会话归档→快照缓存→记忆消毒)和知识活力五维评估体系,在业内率先实现了 AI 的持续进化能力。最终完整实现了多空间知识融合、记忆共享、知识自净化等核心能力。
演讲提纲:
业务背景:企业场景下 AI 记忆缺失的痛点
方案选型:记忆工程 vs 知识工程双轨架构
落地挑战:动态记忆生命周期 + 知识自进化机制
解决思路:六层记忆服务体系 + 知识活力指数
未来规划:记忆自主进化 + Wiki 图谱增强
总结:狍子的核心差异化与业界意义
听众收益:
1. 理解记忆工程与知识工程的完整设计思路与核心架构
2. 掌握知识活力指数、代谢周期等知识自进化机制的实现方法
3. 获得在企业场景中落地 AI 记忆能力的实践经验与踩坑总结
安克 AI 创新和应用演进之路
二十年研发和互联网行业经验,先后任职于金蝶、淘宝/天猫、OnePlus、超级猩猩等企业,一直从事和负责产品研发、数字化和智能硬件等相关岗位,对数字化、高性能计算、云平台、智能 IoT等领域有深入的积累和经验,并擅长于将技术融入商业场景和模式中。
Agent 从“写代码”到“建系统”——技术演进、能力边界与可信工程的挑战
本科毕业于清华大学电子工程系,在美国宾夕法尼亚大学攻读程序语言专业博士,现任粤港澳大湾区数字经济研究院(IDEA研究院)基础软件中心首席科学家、MoonBit团队负责人。
曾任OCaml语言核心开发人员,其主导开发的ReScript语言(原BuckleScript)是首个由中国人主导的国际通用程序语言,官方文档支持多国语言版本。2013年受彭博社邀请开发函数式语言编译器,创建的BuckleScript项目后被Meta等公司采用。2017年回国后成为Meta中国大陆唯一软件工程师,维护BuckleScript并参与Flow语言开发。
2022年加入IDEA研究院创立基础软件中心,带领团队开发MoonBit编程语言及工具链,该语言基于WebAssembly设计,支持云计算与AI开发,已适配RISC-V指令集并进入北京大学、清华大学课程体系。OCaml语言项目获2023年SIGPLAN软件大奖。截至2025年,MoonBit用户已超过10万,预计2027年初达到近100万用户。
Data Agent设计实战:知识准备、库表检索与SQL- Python混合计算
腾讯数据计算平台部,大数据智能体算法负责人,博士毕业于浙江大学,研究方向为大模型智能体。 在 ICML/NeurIPS/AAAI/ACL/VIS 等人工智能和可视化领域国际顶级期刊会议上发表多篇论文。主导研发腾讯一站式大数据智能体开发平台 LangData。
基于AgentScope的金融数据平台Agentic进化之路
瓴岳科技(洋钱罐)数据平台工具组负责人,拥有多年大数据领域相关工程化经验。主导设计并落地 DataPilot 一站式数据开发平台以及 AI Agentic 架构,深度参与基于 AgentScope 的生产级 Data Agent 集成实践。
Agent驱动旅游B2B:全球旅游资源分发的数据架构智能化升级之路
在大数据技术、算法工程、自然语言处理(NLP)和推荐系统等领域拥有深厚的专业积累,擅长通过结合大数据与智能化技术,搭建高效的 AI 智能应用。曾先后任职于腾讯、OPPO、字节跳动和美的集团等知名企业,在字节跳动与美的集团均担任核心技术负责人,主要负责大数据与智能化体系的建设工作。在职期间,参与了腾讯和 OPPO 内部的算法中台与大数据中台建设,此外还主导了抖音春节活动的用户反馈监控、抖音道具性能推荐项目,以及美的集团 AI 战略业务,积累了丰富的智能化产品开发经验。过往带领团队发表数十项专利,多次获得公司最佳技术团队称号,在技术创新与应用方面具备卓越能力。
从 BI 到 Data Agent:传音企业智能分析平台的建设实践与展望
长期从事企业数据平台、BI 分析和 AI Agent 应用建设,关注大模型在数据分析、可信问数、经营报告和企业知识沉淀中的落地实践。近期重点探索传音企业级 Data Agent 的能力规划与工程化路径。
vivo数据研发治理平台DataAgent能力落地实践
深耕中间件与大数据研发15年,主导vivo公司级大数据平台BDSP从0到1落地,覆盖数仓、开发与分析全链路。近年专注AI大模型与数据平台融合创新,持续赋能业务,创造惊喜与价值。
从 BI 到 Agentic BI:面向 Agent 的第三代数据平台建设实践
曾构建世界级流量架构,正建设第三代 AI 数据平台。
面向 Agentic 的 OLAP 架构探索
数年高性能 OLAP 引擎研发经验,开源社区活跃贡献者;近来专注于面向 Agent 的向量数据库、Agent 可观测性等领域的探索与实践。
流式交互与实时洞察:Agent架构如何提升数据产品的实用性
专注于分布式计算和存储,对Spark和PostgreSQL有深入研究,拥有多年StarRocks/Trino/link集群的运维经验,近两年专注于大语言模型在大数据方向上的智能应用。
守矩驭智:知鸟企培智能体技术体系赋能金融企业高质量发展
曾任职百度、搜狗、腾讯等知名企业,深耕AI算法、搜广推算法等领域。现任平安知鸟AI负责人,专注于AI技术在企业培训场景的落地与创新,助力企业在AI时代实现组织能力跃迁。
Agentic AI重塑金融生产力:平安集团智能体平台的探索与实践
清华大学智能技术与系统国家重点实验室信号与信息处理专业硕士,26年人工智能和大数据经验。现任平安科技算法平台部负责人,全面统筹智能体平台及模型训推平台从技术研发到体系化建设的全链条工作。曾获2020年度吴文俊人工智能科技进步一等奖、2022年度广东省科技进步一等奖、2022年度中国人民银行金融科技发展奖二等奖、2024年度中国人民银行金融科技发展奖二等奖等重要荣誉。
从评分卡到智能体:人工智能重塑消费信贷风险管理体系的实践与思考
中国人民银行金融标准制定委员会专家,互联网金融协会外聘专家,重庆数宜信信用管理公司高级顾问,重庆市人力资源开发服务中心认证AI应用讲师;15年商业银行高级管理经验,历任某互联网银行风险管理负责人,阿里巴巴和蚂蚁科技集团高级风险专家。熟悉线上信贷业务的风险模型、风险策略开发,熟悉大数据和人工智能技术基本原理及产业端的应用。
Agents 重构金融 FICC 策略全生命周期管理平台
20 年金融科技一线,做过三套电子交易平台。
2019 年,作为项目经理与核心开发,交付平安证券"领航 (FLEET) 固收外汇电子做市交易系统",获深圳市金融创新奖一等奖。
2022 年,作为交易平台架构负责人,参与交付华泰证券"大象 FICC 多资产做市与风控平台",获人民银行金融科技发展奖一等奖。
现负责华泰"AI+AURORA 策略管理平台"——把 AI Agents 嵌进多资产策略的全生命周期。
AI驱动金融营销合规审核
拥有 6 年数据挖掘与用户增长经验,近 3 年聚焦 LLM 应用与 AI Agent 系统建设,先后主导贷后催收 Agent、理财通 AI 客服、金融营销合规审核等多个从 0 到 1 的 Agent 项目落地,覆盖对话式交互、Multi-Agent 编排、模型训练(SFT/RL/GRPO)及业务闭环全链路,具备从模型数据、大模型训练、SKILL、Agent 架构设计到评测的全栈 AI 工程能力。
获奖情况:
2025 AIIA 金融行业优秀AI案例《金融营销及基金宣推页智能合规审核》
2026 优秀金融科技案例《北京资管协会行业发展报告2026》
2024年度AIIA人工智能先锋案例《理财师敏感话术识别》
移动端 GUI 执行的 Agent Harness 探索
研究方向涵盖 GUI Agent、多智能体框架与端云协同计算。近年在 NeurIPS,AAAI,WWW,CIKM,IEEE TC / TIFS 等会议与期刊发表多篇论文,参与 OPPO GUI 智能体系统研发与 Agent 业务应用上线。
Harness Engineering:大模型Agent执行与控制的系统化工程——从并行计算到智能体编排
技术背景:刘文志是中国高性能计算和 AI 领域的知名专家,中国科学院硕士,出版过《并行算法设计与优化》等四本技术著作。
工作经历:在创立足下科技前,他曾在英伟达、百度、商汤科技、华为等知名企业工作,负责过深度学习平台、异构计算团队以及智能汽车业务。
现任职务:目前他担任深圳市足下科技有限公司的董事长、总经理及法定代表人,同时也担任深圳市汽车电子行业协会的专家委员。
数据科学 Agent Harness 的探索与实践
就职微信实验平台,专注实验决策优化与因果分析Agent工程化落地。从 0 到 1 支持实验平台智能分析体系建设,推动 Notebook 证据链分析、实验报告自动化、CUPED 策略优化和 AgentOS 调度编排等能力落地,专注将复杂分析流程沉淀为可执行、可审计、可复用的平台系统。
Harness Agent在实际业务中的落地现状和未来发展
九年NLP和大模型相关业务经验,公司内做过多场大模型相关专题的分享。
三层解耦 × 三大Agent:货拉拉私域营销的多模态引擎实战
拥有丰富的NLP算法与大模型跨场景业务落地经验,专注于通过AI Agent技术提升业务效率。擅长将大模型与客服、私域、判责、舆情等场景融合,推动 AI 在实际业务中可控、可用、可落地。
Foundation Protocol:AI 社会的基础协议与协调底座
Foundation Agents 社区核心成员,DeepWisdom Research Researcher,长期关注 LLM Agent 与多智能体协作发展,主导 Foundation Protocol 设计与落地。
系统化AI辅助研发破解定制难题——多Agent协同、代码逆向与生成式AI的工程化落地
一从事开发、架构设计、AI辅助研发效能提升能力构建。
能力契约驱动的企业级 Agent 执行范式:Dynamic Workflow 的运行时展开
聚焦 AI Agent、数据基础设施与云原生计算平台方向,主导多项司内平台能力从 0 到 1 孵化与规模化落地,覆盖面向元宝等核心业务的安全沙箱、天穹 WeData Notebook 与 Compute 引擎、LLM Agent 开发平台及 LLM 可观测性平台;在大模型应用、云原生计算与智能系统方向有多项专利与顶会论文积累。
Elastic MCP 及 Agentic AI - 构建可信、上下文感知能力的搜索
中国社区首席布道师。新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过电脑设计,汽车电子,计算机操作系统,通信,云实时事件处理等。从爱立信开始,诺基亚,Ubuntu 到现在的 Elastic,从事社区工作有将近 20 年的经历。喜欢分享自己所学到的知识。坚信帮助别人就是帮助自己。希望和大家一起分享及学习。欢迎大家来参阅 Elastic 官方中文博客 elasticstack.blog.csdn.net
从 BizDevOps 到 VibOps:基于 spec-first 的企业级 AI Coding Agent 工具链实践
2015年毕业于东华理工大学。现任深圳价值网络科技有限公司(隶属华盛资本集团)技术副总监、部门技术负责人,拥有11年金融科技研发与架构经验和60+人团队管理经验,长期负责信贷、证券金融核心系统架构演进,覆盖交易、支付、清结算、金融中台、大前端治理与研发效能体系建设。近年专注AI工程化与研发效能变革,开源spec-first项目,推动从TDD向SDD升级,将AI Coding融入需求、编码、Review、部署和缺陷回流,相关实践已在技术中心范围使用。
从自动化到自进化:大数据运维Agent实践与思考
先后承担中国移动数据仓库(经营分析)系统的规范设计、验收、运维,主持设计了中国移动规范符合度测试、POC选型测试等技术文档80余册、300多万字;带领团队构建新一代数智化运维体系,承接梧桐大数据6.4万+台节点规模,600+PB价值数据资产数智化运维工作;开展中国移动集团关键核心技术攻关,完成大数据架构去IOE,操作系统国产替代。荣获通信行业协会荣誉5项,移动集团级荣誉8项,多项信通院标准起草人。
大模型自进化工程实践
顺丰供应链Agent落地实践:供应链AI从工具走向全域智能操作系统
电子科技大学信息安全硕士,专注于人工智能与运筹优化技术在物流供应链领域的落地。
加入顺丰科技以来,先后负责集团智能决策体系与智慧供应链商业化产品体系的构建与管理工作。主导研发物流决策大模型"丰知"、智慧供应链控制塔"丰智云塔"及决策平台"丰智云策"等核心产品,服务数百个SKA客户,实现千万级营收。在运筹优化领域,构建大规模网络规划、路径规划、资源调度等核心算法体系,助力集团累计降本超十亿元。
曾获中国物流与采购联合会科技进步奖二等奖、物流技术创新奖、CCF BDCI最具商业价值奖等多项荣誉,产品入选Gartner SCP亚太榜单。
本体作为工业 Agent 的“语义罗盘”——COSMO-Claw 多智能体协同的可信落地实践
余锦泽,卡奥斯数据智能首席科学家、大规模个性化定制系统与技术全国重点实验室核心成员,东京大学博士。深耕工业视觉、数字孪生与具身智能,以第一/通讯作者发表顶会顶刊 29 篇、第一发明人授权专利 29 项,曾获日本机器人大奖、泰山产业领军人才。
通义多模态、多端GUI智能体Mobile-Agent应用实践
阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
大模型时代智能文档Benchmark落地实践
硕士毕业于哈尔滨工业大学(深圳)计算机科学与技术学院ICRC实验室,目前就职于阿里巴巴企业智能算法团队,主要从事多模态分类、智能文档方面工作。团队与通义实验室Qwen团队、智能引擎团队、东北大学IR实验室、清华大学NLP实验室合作,共同沉淀 UNIKIE-BENCH、MMM-BENCH、CC-OCR-V2 等多个智能文档抽取基准。
AI评测驱动系统自迭代—1688 Agent自动化评测实践
深耕电商与产业互联网数据科学与分析十多年,专注 AI 重构业务数据工作流&数据agent建设,主导品类经营 AI Agent 体系与 1688 AI 应用评测平台从0到1落地。熟悉B2B、近场电商、金融风险业务,完整经历了数据从"分析洞察"到"驱动决策"再到"AI自动化执行"的能力跃迁。始终坚信数据的价值不止于报表,更在于重构业务流程、让决策自动发生。
从 Demo 到 Production:高确定商业场景下的Agent实践
长期专注于 Agent 在真实商业场景中的产业化落地,主要负责运满满的 Agentic 化架构设计与工程实践。当前重点探索长期运行 Agent、事件驱动感知、状态管理、高确定性执行与 Agent 工程体系建设等方向,推动 Agent 从 Demo 能力向 Production 系统演进。
机器人开发进入 Agent 时代:Moss 如何重塑研发流程
地瓜机器人生态软件工具负责人,具身机器人社区“古月居”生态合伙人,ROSCon China 机器人开发者大会联席负责人。专注于机器人操作系统及人工智能相关技 术的推广与应用,撰写了《ROS2智能机器人开发与实践》等畅销技术书,并参与负责组织 ROSCon China 机器人开发者大会。主导了OriginBot 等具身机器人产品系列的研发工作。曾获ROS布道师、NVIDIA 中国开发者最有价值专家等荣誉称号。
荣耀 YOYO 智能体的应用实践
10+年企业数智化经验,聚焦多端感知、跨端协同与智能体交互,致力于通过智能体实现“意图驱动服务”的下一代交互体验重构。
能共情的多面手:货拉拉AI客服数字人升级
负责大模型在多个场景中应用落地相关工作。在AI客服、AI邀约的大模型应用与全链路评测体系建设方面拥有丰富经验。致力于通过前沿AI技术解决实际业务问题,创造业务价值。同时深耕物流货运行业多年,曾就职顺丰科技,主要负责供应链解决方案算法及预测方案开发。
AI代码逻辑炼金Agent:逆向萃取系统代码图谱到自动化迭代的研发效能实践
资深IT团队管理者,拥有多年大数据、应用团队的技术架构规划与项目统筹管理经验。深耕大数据创新领域,斩获多项国内外创新类奖项,专业能力与行业成果备受认可。曾受邀担任 DataFun 线下特邀讲师,分享行业实战经验与管理架构心得。
企业大规模AI Coding落地:如何控制大模型成本?
计算机硕士,曾长期担任霍尼韦尔全球软件研发经理。从业十余年来,专注物联网技术、AI、大数据技术研发,具有丰富的大型研发团队管理经验。职业生涯历经移动互联网、工业物联、智能家居、智慧社区等多轮技术浪潮,主导 AI 算法、智能传感、物联平台等核心项目攻关,累计取得多项国内外专利、学术成果与软著,具备丰富的全球化项目交付与技术创新经验。现阶段聚焦 AI + Data 技术在智慧社区场景的落地变革,探索数智技术赋能行业发展的新路径。
AI自主迭代修复驱动开发测试端到端闭环实践
中兴通讯应用软件资深专家、有线院MMVS产品AI提效负责人,中兴青年奖获得者。长期深耕通信软件研发与工程实践,专注AI驱动研发效能提升,积极推动Agentic AI在大型系统开发中落地。
企业AI-Native研发转型:构建人机协同新范式
2009年毕业于武汉大学软件工程专业,入职深信服至今,曾担任技术专家、架构师、运营负责人、研发主管等岗位,熟悉AI深度学习、大数据、安全、云计算、终端等领域,拥有专利10余篇,当前对内负责AI驱动公司研发全过程提效,对外负责CoStrict产品(一款面向企业严肃开发的开源AI编程工具)。
Agentic4Rec:理论、算法、大规模工业落地应用与挑战
清华大学毕业,高级算法研究员。研究方向涵盖信息检索、推荐系统与多模态内容理解。2019年加入腾讯,专注于用户增长场景的算法研发;近年研究重心聚焦生成式推荐(GenRec)、大模型推荐(LLM4Rec)与智能体推荐(Agent4Rec)等前沿方向。研究成果发表于 ICML、ACL、WWW、SIGIR、KDD、RecSys 等领域顶级会议,相关算法已在十亿级推荐场景中成功落地。
C2AI2X 协议与真机生态的统一技术架构
刘智勇是具身智能方向技术专家和科学家,机器人领域青年领导者之一,7年知名机器人公司首席技术官经历,阿里巴巴机器学习算法研究经历。苏黎世联邦理工学院计算机系全奖博士休学创业,曾担任苏黎世联邦理工学院计算机系研究助理,师从世界著名的机器学习教授,同时拥有工学硕士和工学学士学位,20+专利第一作者, 在国际顶级期刊和会议发表论文6篇。他的学术研究领域包括具身智能、机器人学习、移动机器人技术。他是文生行动推理智能体JI Agent的原作者,ZROS核心作者,国家奖学金获得者,清华大学启航奖获得者、最佳论文奖获得者,中国服务机器人及特种机器人产业联盟专家委员会委员。
下一代 Agent 形态探索:从打破数字世界信息孤岛,到突破物理世界感知屏障
西安交通大学博士,现任OPPO研究院高级算法工程师,在KDD、IEEE TKDE、ACL、IEEE TIP、 ECML PKDD等国际会议期刊发表多篇论文,现研究方向涵盖GUI Agent、多模态Agent、多智能体协同系统等。
一个人,五个 Agent:把功能开发产品化的端到端探索
毕业后先后就职于两家美企,从事高性能计算和互联网后端研发工作。2007 年开始合伙创业,并任职 CTO,拥有 11 年的社交 App 创业和并购经验。之后于 2018年加入晓黑板,担任 CTO。热爱开源技术,拥有 20+ 年的开发、微服务架构经验以及十多年的技术团队管理经验。在微服务架构、分布式系统、机器学习模型上有深入研究。还是持续学习者,主张系统和架构尽可能保持简单,工具大于文档和约定的理念。
小米 Data Agent Harness 落地实践
现任小米高级算法工程师,长期深耕 Data+AI 领域。主导落地用户画像、智能分析、数据问答、Data Agent 等数据智能方案,2026 年 5 月 Bird 总榜第三。
本体驱动企业Agent决策的探索与思考
华为数字化高级技术专家。拥有 15 年深耕企业数智化转型的深厚积淀,职业历程覆盖中石油、SAP等跨行业头部企业,在AI、大数据、数据底座构建及云原生技术领域具备全栈技术能力。曾作为 AI 应用首席架构师,主导推动AI大模型技术在华为云研发体系、全球营销服务网络及智能资产运营等关键业务场景的深度应用,通过技术创新实现业务流程智能化重构,持续为业务增长注入技术动能,显著提升运营效率与服务质量。
面向企业智能办公Agent的本体驱动知识工程构建
研究生毕业,10+年算法研发经验,CCF专业会员,参与语音识别评测T/ISC 0034-2023标准制定,负责过音频前后端处理,弱网优化,音视频质量提升,智能内容安全审核“T网”,内容理解“T悟”等大型项目,此前主要负责AIGC类算法研发,包括自研LLM领域大模型,语音大模型,图像生成等。曾作为“灵声讯”创始人,参与智能媒体技术自媒体运营和推广。
看见、记住、行动:多模态 Agent 的记忆工程实践——从流式视频伴随到端侧具身智能体
深耕大模型与多模态方向近三年,专注视频智能体工程落地与时序感知记忆管理机制研究。参与了 OPPO 一键问屏与实景问答两款多模态 Agent 产品的研发,历史迭代产品分别在 2024、2025 年 OPPO 开发者大会正式亮相。拥有 7 年一线算法工程经验,长期负责从模型到系统的全链路交付。
从“完成任务”到“持续进化”: AI Agent 记忆能⼒的评测与实践
创邻科技图技术和图算法专家,在分布式图存储与图计算领域拥有近 10 年的研究与实践经验,曾主导并参与 LDBC 图基准测试标准制定。⽬前主要关注 Graph4AI 与 AI4Graph ⽅向,并在相关科研与落地实践⽅⾯拥有丰富的经验。参与编写图数据库相关书籍、⽩⽪书及⾏业标准,在 VLDB、ICDE 等数据库顶会上发表多篇⽂章,并荣获2025 VLDB 最佳论⽂提名奖。
狍子AI的记忆工程与知识工程 — 有记忆、有知识、会进化的 AI 伙伴
香港城市大学数据科学博士,现任腾讯算法工程师。加入腾讯后主要参与狍子AI知识库Agent和Tomoro数据分析Agent开发,负责Agent上下文管理、知识检索与数据分析相关能力建设。