使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2 天沉浸式学习交流 | 15+前沿分论坛 | 60+真实应用案例
科技日新月异,大数据与人工智能等技术的迅猛发展正引领各行各业迈向变革的新纪元。数据量的激增与计算能力的跃升,成就了大模型技术的崛起,为人工智能的飞跃式发展注入了新的动能,数据与智能双向深度融合彰显出无限潜力。
经历了初期的狂热,业界对大模型的看法已逐渐回归理性。技术终究是工具,其价值在于落地应用与创造实际效益。大模型的进一步发展对数据科学理论与数据工程技术提出了日益迫切的需求;数据在大模型产业发展中扮演着日益重要的角色。大模型与大数据如何双向奔赴、如何深度融合、如何赋能产业,成为了当前大数据与人工智能研发的关键议题。
基于此,本次“大模型时代,Data+AI的变与不变”线下大会汇聚业界顶尖专家学者与行业领袖,共同研讨大数据、大模型等技术的最新动态与应用实践。我们期待通过这一平台,激发知识交流与思想碰撞,发掘创新与合作契机,共同探索数据智能推动行业数字化转型升级与高质量发展的路径。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
在大数据、人工智能领域拥有超过20年研发经验。目前负责阿里云大数据和机器学习平台,支撑达摩院、淘宝、菜鸟等大数据存储、计算、分析和机器学习的需求,同时服务于数以万计的云上客户。
曾担任NewsBreak工程总负责人,负责AI系统、推荐、广告等业务,并成功推动NewsBreak技术及商业化转型。
曾担任微软搜索与人工智能事业部工程副总裁和全球杰出工程师,带领团队研发搜索、对象存储、大数据计算、深度学习平台和框架,支撑微软Bing、Office365、Azure、大语言模型研究等业务。创建和领导了大规模深度学习团队DeepSpeed,并发布了当时最大的语言模型170亿参数的Turing-NLG。
纽约大学计算机硕士学位、中国科学技术大学计算机和经济管理双学位。
阅文集团技术副总经理,AIGC负责人,腾讯云最具价值专家、复旦大学计算机学院专业硕士导师。有着近15年的人工智能、大数据研发管理经验。在AIGC、个性化推荐、搜索、大数据挖掘、自然语言处理等领域都有丰富的实践经验。目前主导人工智能技术在集团内部的研发和应用落地,带领团队研发了阅文妙笔大模型和多模态大模型,并在作家辅助创作、角色对话、增长素材和机器翻译等大模型应用场景上也取得了不错的成果。对内容业务有深刻理解,也主导推进智能风控、推荐系统、反盗版等公司重点项目落地。曾任百度人工智能事业部技术经理,负责过百度推荐、精准广告、图片搜索、大数据商业化等项目。
阿里云EMR研发团队负责人,资深技术专家,Apache Flink & HBase PMC Member,Apache软件基金会Member。
多年 IT、互联网工作经验,在基础平台架构与研发、金融分布式系统、金融科技探索与应用方面有丰富经验。负责度小满整体技术的规划与推进,以及信贷技术架构从1.0到4.0的演进,支持了业务多年数倍的持续增长。
在金融科技探索上,主导了区块链、复杂工程技术、虚拟现实、物联网技术、LLM的探索与应用落地;从0组建了百度第1个区块链研发团队,相关工作荣获了福布斯全球、哈佛商业评论、工信部等国内国际荣誉。推动与参与了多项国内国际标准的制定,以及白皮书、蓝皮书的攥写,个人累计申请了60多项国际、国内发明专利。
胡云华,西安交通大学和微软亚洲研究院联合培养博士,先后担任微软亚洲研究院副研究员、阿里巴巴达摩院资深算法专家、支付宝中国首席数据官、智谱华章副总裁,在搜索、广告、推荐、大模型研发、用户产品创新方面拥有丰富经验。
13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。
具有多年在传统数据库管理和大数据分布式平台开发与维护的专业背景。熟练掌握大数据技术,能够高效地进行批处理和流处理任务的设计和实施。对数据湖架构的构建和优化也有深入研究,能够帮助企业从海量数据中提取有价值的信息,支持数据驱动的决策制定。
目前在eBay作为数据平台研发总监,带领团队负责云原生的数据湖,分布式搜索引擎,调度系统,存算分离计算引擎,OLAP离线数据库,数据开发平台等技术的实施,优化,开发工作。
现就职于京东零售。之前担任平安壹钱包大数据部门副总经理,带领团队致力于构建高效的数据分析体系,通过创新技术推动业务增长与客户体验优化,主导了多个关键项目,包括企业级数据平台的搭建与升级、智能数据分析工具的研发等,显著提升了公司内部决策效率。专注于深度学习、自然语言处理等领域的大规模机器学习模型开发。并积极推动研究成果向实际场景转化,特别是在数据管理、风险控制等方面取得了突破。
美的集团首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow IET Fellow ACM Distinguished Scientist。
吴友政博士,京东科技集团语音语义算法部负责人、高级总监。博士毕业于中国科学院自动化研究所,毕业后在日本情报通信研究机构、英国爱丁堡大学、索尼中国研究院和爱奇艺负责自然语言处理、语音识别、机器翻译等前沿技术研究和产品研发工作,在国际自然语言处理顶会和期刊(如ACL、NAACL、EMNLP、AAAI、ICASSP等)上发表多篇学术论文。曾获得语音识别(IWSLT2012、IWSLT2013)和对话式机器阅读理解(QuAC 2020)比赛的冠军。连续2年主办京东人机对话挑战赛。技术产品化上,带领团队打造了基于多轮对话技术的智能客服平台言犀、基于多模态内容生成技术的品创等产品。曾获得京东集团技术金牛奖等荣誉。
王涛,滴滴数据平台产研负责人,2018 年加入滴滴,专注于构建智能、易用、安全的数据产品矩阵,并推动 AI 技术在数据平台的深度融合。曾在阿里巴巴集团担任工程技术关键岗 8 年。技术面覆盖大数据、人工智能、泛前端等多个领域。
企业架构和数字化转型专家,北京大学理学硕士,银行、保险、车企20年工作经验,《企业架构驱动数字化转型》作者,“金融IT那些事儿”公众号主理人。
阿里云AI搜索研发负责人,负责阿里云AI搜索产品OpenSearch、阿里云ElasticSearch AI研发,以及开源搜索引擎Havenask研发。覆盖AI搜索、向量检索、大数据检索、对话式搜索等多个场景。带领团队研发多款搜索、推荐和智能问答类产品研发。目前主要聚焦在大模型AI搜索研发,关注大模型AI搜索对业务和客户的价值。
AI数据生产(标注、数据集、合成)、AI安全(评测、防御)、AI软硬件一体、AI营销相关领域从业者。
企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。
胡月军,现任 ProtonBase 技术副总裁,从事存储与计算引擎的设计与研发工作,致力于打造 AI 时代云原生一体化的数据存储,计算和管理系统。曾任阿里巴巴计算平台事业部资深技术专家,发起和参与了阿里巴巴交互式分析引擎 Hologres 的研发。在此之前,从事5年搜索和广告引擎的设计与开发,负责过阿里巴巴淘宝、天猫、1688、Sourcing 和 AliExress 的搜索与广告在线引擎系统,主导过阿里巴巴国际搜索和广告引擎在离线的一体化升级改造。
金融场景 GenAI 创新应用 | 大模型前沿技术探索 | AI时代数智团队危与机 |
|
|
|
| AI 搜索技术探索与应用 | 大模型驱动的运营与营销升级 | 生成式推荐系统新范式 |
|
|
|
| 构建高效AI Infra,赋能应用开发 | 面向智能体的下一代数据平台 | AI Ready的数据管理 |
|
|
|
智能分析:从ChatBI到Data Agent | Agentic AI 前沿技术 | Agentic AI 最佳实践 |
|
|
|
| 湖仓一体到智能湖仓,AI数据基础设施 | 大模型增强用户体验与客户服务 | 降本增效:大数据计算革新 |
|
|
|
2011年加入阿里巴巴,长期致力于淘宝搜推广业务和系统建设,见证了阿里电商业务从PC到无线时代的转型及背后架构的持续演进升级,包括对淘宝AIOS引擎体系发展、深度学习算法大规模应用及国际化应用。期间负责过淘宝推荐系统建设,主导TPP —— 阿里首个大规模Serverless推荐计算平台建设,有效支撑亿级用户逛淘宝的丝滑体验。
现任快手商业化技术业务中台负责人,聚焦AI技术研究和商业落地,重点关注TOB场景的AI实践,对模型量化、推理优化及AI Agent价值创造有浓厚兴趣。
平野毕业于英国曼彻斯特大学计算机系,是金融科技领域的专家和创新引领者。他创立并领导天弘基金算法团队,全面负责投研、营销、风控等业务的智能化规划与实施。同时,他也带领公司金融大语言模型团队,研发了“弘小助智能助手”,并荣获2023年国家金融科技发展奖三等奖。
他曾在百度、蚂蚁金服等企业任职,是支付宝第五代风控引擎AlphaRisk的核心开发者,项目曾获浙江省科技进步一等奖。他在人工智能领域经验丰富,擅长NLP、深度学习、图谱等前沿技术,致力于构建新一代智能投研、风控与营销系统,推动金融智能化落地。
蚂蚁财富投研支小助技术负责人、AntAlpha 投研量化平台技术负责人。曾任 DecentGalaxy 量化基金技术合伙人、青岛基金协会特邀专家、中国海洋大学社会讲师。长期致力于经典量化投研、人工智能算法、大模型多智能体技术与金融研究的有机结合与平台化探索。
负责京东集团实时数据平台的研发及技术架构演进,专注于大数据平台基础架构的创新与优化,在实时计算、云原生、数据湖等领域拥有深厚的技术积累及业务落地实践。硕士毕业于清华大学,曾就职于 FreeWheel,任Data Infra架构师&实时团队负责人。
快手数据引擎技术中心负责人,大数据平台架构师,大数据基础架构技术爱好者,开源项目“XLearning”作者,主要研究领域为Data/AI Infra等。
京东零售用增技术团队负责人,十余年数据科学与算法架构研发经验,专注于通过前沿技术手段驱动业务增长的实践探索。现任 AFCEC 首席行业专家顾问及 CCF 行业标准化小组成员;作为行业峰会出品人活跃于国内知名社区,参与组织 CAAI 2022、CCF-BDCI 2023 等全球人工智能算法赛事。累计申请专利 30 余篇,国际顶会论文数篇。
本科至博士就读于清华大学自动化系,研究智能优化方向。前美团配送核心算法团队负责人,目前负责58集团本地服务业务的产品和技术团队,以及汽车业务的技术团队,致力于AI技术驱动产品创新,孵化了淘阿姨AI和大师兄AI等新产品。
清华大学领创工博,NIPS/ACL等AI顶会审稿人。
- 主持或组织完成十四五、科技部、北京市等20余个科研项目,其中“十四五”项目6项;
- 主要负责产品技术研发及应用推广工作,拥有授权专利45项;
- NIPS/AAAI/ACL等顶会论文数十篇,同时也是多个AI顶会审稿人;
- 主持认知数字疗法最佳剂量研究填补国际空白,成果发表于Nature子刊;
- 主持研发平台获得2023年中华医学科技奖一等奖;
- 2023-2024年全球数字经济大会AI典型案例2次,国际服贸会AI案例1次,全球数字疗法TOP30一次;
- 拥有10年深刻的产业和技术整合产品化落地和前瞻性能力,作为产业AI引领者在 QCon/SACC/DTCC等行业论坛发表演讲和出品累计二十余次。
贝壳找房技术总监,贝壳基础设施方向负责人,先后就职于中国数码,微博。长期从事云计算、大数据和机器学习相关基础建设,关注提效和FinOps 相关领域,对居住行业有深刻理解。
北京邮电大学通信与信息系统博士,师承两院院士陈俊亮老师,在搜索推荐和机器翻译等人工智能相关领域有十年以上研发经验。有 10+ICLR/ICASSP 等顶会论文和国内外专利,带领团队获得 WMT/WAT NEWS/DOMAIN/QE/APE 冠军。希望致力于机器翻译等技术方向,共建高质量全栈的人工智能服务和平台。
芝麻企业信用技术负责人,负责整体技术工作。之前就职于网商银行,Uber美国以及PayPal,在综合金融系统,Uber增长平台,基础架构有多年经验。获得加州大学默塞德分校硕士,从事计算机视觉相关研究。
抖音内容技术方向负责人。毕业于中科院计算所,主要研究方向包括多模态内容理解、多模态大模型、推荐大模型等。从 0 到 1 带领算法团队构建起抖音及相关产品平台的多模态表征能力、多模态大语言模型能力,公司级小样本训练平台,推荐基础特征能力,团队的工作产出在公司内的众多业务有深入应用,对各产品业务的增长与运营模式地进化有极大的推动作用。个人出版过《深度学习轻松学》《强化学习精要》《人工智能:深度学习核心算法》书籍,曾发表多篇论文。
毕业于中国科学技术大学,获得计算机科学博士学位。随后加入理光研究院,并在亚利桑那州立大学(ASU)担任博士后研究员。2014年回国加入阿里巴巴,历任蚂蚁集团风控科技总监。现为蚂蚁数字科技AI技术负责人。
电子科技大学硕士毕业,曾服务于中通服,TeraData 等知名公司。现就职于平安科技数据管理部门,任技术平台组负责人(高级经理),曾负责引领集团数据中台的规划、建设,现负责集团数据技术管理运营工作以及集团数据管理相关平台的建设。
云器科技联合创始人兼 CTO,曾任阿里巴巴 P10 研究员,主导了阿里云飞天大数据平台二代研发及落地,曾于微软云计算和企业事业部工作近十年,浙江省科技进步一等奖获得者。
以数据为中心的大模型行业发展演进路径
阿里云OpenLake:AI时代的全模态、多引擎、一体化解决方案
大模型驱动的推荐系统新范式:vivo的实战经验与未来展望
生成式AI正加速推动推荐系统的范式演进,从"理解用户"走向"生成内容",从"精准匹配"迈向"主动创造",推荐系统的核心能力正在被全面重构。
本次演讲将结合vivo团队多年深耕商业广告与内容推荐系统的实战经验,深入剖析从深度学习到大模型赋能下推荐算法策略的重构路径,系统分享推荐系统与生成式技术深度融合在vivo互联网业务的实践与落地成果,为行业迈入智能生成驱动的下一代推荐系统提供趋势洞察与前沿参考。
听众收益:
1. 从0到1构建一流高性能和高可用性的推理中台、训练中台、数据中台的实践与成果;
2. 超大规模推荐系统模型,Scaling Law在推荐系统的实践;
3. 推荐系统与生成式技术深度融合在vivo互联网业务的实践与落地成果。
从深度学习到大模型:技术趋势与产业实践
报告将分享大模型技术发展趋势,重点结合深度思考、智能体等技术演进,介绍大模型训练推理的挑战、技术创新和产业应用。
演讲提纲:
1. 从深度学习到大模型
2. 大模型技术趋势:智能体、多模态统一、强化学习等最新技术进展及趋势
3. 大模型高效训练与推理
a. 大模型训练:并行策略、弹性容错等多维优化
b. 大模型推理:压缩、推理和服务协同提升大模型推理性能
c. 异构硬件兼容:高效兼容多芯片架构的软硬协同优化
4. 大模型支撑智能体构建的核心能力及产业实践
a. 智能体构建对模型核心能力的挑战与应对
b. 智能体应用的典型场景与产业实践案例
AI浪潮下的投资洞察:趋势、潜力与决策逻辑
本次演讲将结合一线投资实践,分享对全球AI技术演进趋势的独到观察,深入剖析大模型技术背后的商业潜力与投资逻辑,并探讨在当前AI大浪潮的背景下,投资者如何甄别高价值AI项目。演讲还将涵盖对创业者的务实建议,包括融资策略与退出路径的规划,为与会者提供技术与资本交叉视角下的深度思考。
演讲提纲:
1. AI技术趋势:从实验室到产业落地的关键演进
- 全球AI技术发展阶段性特征(从底层Infra到大模型LLM到应用AI Agent和Physical AI等)
- 当前AI技术与产业应用融合的案例(如AI在各行业的应用 包括金融、制造、医疗等)
2. AI产业链的机会和潜力:商业价值与投资逻辑
- AI产业链的多层次机遇:AI Infra(算力/数据)、AI LLM(算法)、AI应用(AI 通用&垂直Agent/AI机器人/AI智能硬件等)
- 投资视角下的大模型商业化瓶颈与 scalability(scalability 可扩展性)挑战
- 中美技术路径对比与中国市场独特机会(政策驱动、数据生态、应用场景)
3. 投资决策核心:关注技术、市场与资本的匹配性
- 技术壁垒与团队能力:如何评估AI项目的技术可行性与团队执行力
- 市场时机与赛道选择:从底层基础设施到上层应用的机会探索和延展
- 资本策略与退出路径:人民币市场主导下的融资节奏与“二级思维”(IPO退出规划)
4. 给创业者的建议:在AI浪潮中精准定位与融资
- 融资故事线梳理和定位:明确技术产品化路径与商业化场景(避免“为AI而AI”)
- 匹配投资人预期/高效执行:硬科技与实体行业的周期性特点(在能融资的时候融资 而不是在想融资的时候融资)
- 政府与产业资本的角色:如何借助政策与产业资源加速发展(从财务机构到产业资本到政府国资的多元化融资途径)
听众收益点:
- 明确技术产品化路径与商业化场景(避免“为AI而AI”)
- 匹配投资人预期:硬科技与实体行业的周期性特点
- 政府与产业资本的角色:如何借助政策与产业资源加速发展
神策分析在BMW集团的应用实践
一、故事线:埋点有什么难的? 但在跨国集团公司的背景下,3个月的实施路径上确实踩了很多坑:
1. futter 埋点采集适配(可展开,app开发框架为futter,在集成中存在版本兼容性问题,神策埋点团队赶工开发,完成适配工作)
2. 埋点规范问题,集团总部有一套埋点规范,不能更改,无法直接使用神策埋点规范,需要做大量的埋点到神策事件的映射工作。
3. 报送给德国总部的countly埋点方案继续保留,同时替换原MZ埋点监测方案。
4. 埋点字典维护问题,需要做大量的埋点到神策事件的映射工作。后续定开埋点地图和埋点管理平台来管理和维护埋点的设计和开发工作。
5. 历史埋点数据数据导入神策分析,将历史的MZ埋点数据经过一定的处理导入神策分析,为业务实现了无缝切换埋点数据,保障数据分析的连贯性
二、技术方面
1. 埋点预处理插件的架构设计
2. 定开的架构设计,埋点数据与CDP系统集成
3. 智能推荐引擎的架构设计,基于用户行为数据的APP社区内容推荐
三、未来展望
1. 伴随神策分析的升级,能在app产品优化、运营优化上提供更加深入和完善的功能,达到更好的效果。
2. 继续探索神策分析埋点数据与AI/LLM等技术结合的应用场景
基于知识库构建数据Agent,及其在CDP中的运营实践
主要介绍神策在新一代产品中,基于行业认知和客户已有知识构建知识库,并基于知识库构建数据分析 Agent 和运营 Agent,帮助使用者降低使用门槛、扩大使用访问,在这个过程中努力完成产品定位从辅助工具到最终交付效果的转变。
听众收益点:
可以了解到在真实的实践场景中,如何构建知识库和 Agent,在这个过程中碰到了哪些挑战和问题,以及如何解决的。也可以了解目前真实项目环境中,Agent 的落地效果如何,是噱头还是真能创造价值。
广告业务中大模型特征入模建设应用实践
AI Agent 在物流业务场景的应用
近年来,随着大模型与AI Agent技术的快速演进,物流行业正迎来智能化升级的新机遇。作为连接司机与用户的同城货运平台,货拉拉面临客服业务多样、场景复杂、咨询量大、响应时效要求高等挑战,急需通过智能体技术提升服务效率与用户体验。过去一年,我们围绕物流业务特性,构建了具备任务理解、工具调用、多轮对话的AI Agent客服系统,并成功实现规模化落地。
本次分享将给大家带来货拉拉AI Agent在物流场景的应用,深入探讨关键实践与落地效果。
演讲提纲:
- 货拉拉业务介绍
- 货拉拉AI Agent客服落地实践
- 货拉拉AI Agent未来应用展望
听众收益:
- 了解AI Agent在复杂物流场景中的落地路径与关键挑战
- 获取物流行业智能客服系统的实战经验
- 洞察AI Agent在物流行业的未来演进趋势
知识工程体系建设:大模型精细化广告营销应用实践
本次分享将围绕“知识工程体系建设”展开,分享大模型在精细化广告营销应用中的前沿实践。我们将首先剖析当前广告营销在精准触达、动态响应等方面面临的挑战,回顾大模型时代之前知识工程的构建路径,进而探讨大模型如何驱动知识处理的范式革新——从构建走向涌现与对齐。在此基础上,聚焦C端生成式特征的创新应用,以及B端基于生成式画像与基于仿真环境的生成式强化学习出价策略,系统呈现知识工程在提升广告投放智能化水平中的核心价值与实践蓝图。
演讲提纲:
1、精细化广告营销面临的问题
2、大模型之前的知识工程
3、大模型时代的知识工程
4、C端建设与应用
5、B端建设与应用
听众收益:
1、知识工程新的尝试
2、生成式算法应用
大模型在得物社区内容搜索场景落地实践
大模型强大的基座能力、世界知识和推理能力,为搜索体验的革新带来了前所未有的机遇。本次演讲聚焦于垂类大模型如何深度融入得物社区内容搜索的全链路(意图理解、召回、排序、增长),解决社区内容理解的独特挑战,并最终显著提升相关性、内容质量、多样性和用户发现效率。我们将深入剖析落地过程中的关键技术难点、创新性解决方案、实际效果指标以及宝贵的经验教训。
演讲提纲:
1. 背景与基础:得物社区搜索架构概览
1.1 搜索全链路核心模块解析
1.2 社区内容理解的特殊性
1.3 现有技术栈的局限:传统NLP、规则、浅层模型在处理上述特殊性时不足
2. 垂类大模型的独特价值
3. 攻坚克难:落地垂类大模型的核心难点与解法
3.1 难点一:高质量垂域数据匮乏 & 标注成本高
3.2 难点二:模型效果、效率与成本的平衡
3.3 难点三:多模态融合与理解
3.4 难点四:垂域适配与持续进化
4. 实践落地:大模型赋能搜索核心链路
4.1 大模型相关性数据蒸馏
4.2 Query理解:生成与改写
4.3 AI 搜索:大模型驱动的端到端体验升级
5. 效果验证:数据说话,核心指标提升,A/B 实验对比,典型搜索案例展示
6. 总结与反思:关键成果复述,核心经验与启示,挑战与未来方向
听众收益:
1. 了解搜索系统整体架构
2. 大模型如何跟现有搜索链路结合,提升用户体验
3. AI搜索对比当前搜索系统的价值增量
4. AI搜索如何跟社区结合,更好的组织商品和内容
AI搜索的技术效能:从“检索”到 “洞察”
AI搜索的技术效能:从“检索”到 “洞察”
1.趋势:信息检索的Agentic时刻
2.挑战:企业搜索的新观察
3.实践:从‘检索’到‘洞察’的AI搜索
4.未来:构建AI搜索基础设施
基于LLM淘工厂智能服务托管实战
近年来,随着大规模语言模型(LLM)的快速发展,AIGC(生成式人工智能)技术正在深刻重塑电商领域的各个环节,为消费者和商家带来体验和效率的提升。在这一背景下,提升淘工厂商家的售前与售后服务能力成为亟待解决的关键课题。
为此,我们设计并实现了一套基于LLM大模型的智能客服托管链路,通过全链路的技术优化,包括商品多源知识构建、在线推理与幻觉控制、以及智能交互Agent的能力升级,显著提升了智能服务场景的整体体验。
本次分享将聚焦于LLM淘工厂智能服务托管相关技术实践,深入探讨其创新点与落地效果。
演讲提纲:
1. 淘工厂智能客服的演进路径
2. 基于大模型商品知识源构建
3. LLM大模型在线推理及幻觉优化
4. 智能Agent能力升级
5. 总结及展望
听众收益:
1. 了解LLM大模型如何重塑智能客服链路。
2. 了解大模型在线推理优化优化,包括COT推理、RAG、微调优化、偏好优化等大模型相关技术。
3. 了解Agent在智能客服领域的实践应用。
快手AI搜索实践:基于LLM的检索规划与生成优化实战
AI搜索是当前大模型较有希望和前景的一项落地应用,随着大模型理解、推理、生成能力的提升,借助模型能力帮助用户进行检索和内容梳理,让用户更便捷、准确的获取信息,能够有效提升用户的整体搜索体验,带动搜索产品体验的变革。
本次分享主要聚焦于快手在AI搜索中的一些技术探索,面对检索资源中噪声多、模型存在幻觉、答案质量和用户体验不易评价等挑战,如何对基于LLM的检索规划进行优化,以提升参考资源的质量,以及如何利用LLM的post-train相关技术如GRPO等优化模型能力,以提高答案生成效果和降低答案生成成本。
演讲提纲:
1. 快手AI搜索业务场景
2. 快手AI搜索整体实现方案
3. LLM检索规划优化
4. 答案生成模型优化
5. 总结与展望
听众收益:
了解AI搜当前常用的技术范式
深入了解大模型相关技术在AI搜索中的运用
AI搜索在小红书的落地实践
当前 AI 搜索领域发展迅猛,小红书凭借用户深厚的搜索心智与站内丰富的优质内容供给,已形成独特优势。在此背景下,如何将 AI 搜索能力与站内优质资源深度融合,成为业务发展的关键方向。
而在当下的搜索场景中,两大核心难点亟待突破:一是如何更精准地捕捉并命中用户真实需求,二是如何有效提升用户需求的满足效率。针对这一现状,我们设计了面向搜索场景的 Agent 架构,通过 “Agent+workflow” 的协同模式,成功实现了业务效果的显著提升。
演讲提纲:
1. 背景:快速了解小红书搜索
2. AI搜索的基础
2.1 Agent架构
2.2 RAG
3. 小红书问一问方案
3.1 X-Agent
3.2 基于多路召回的RAG能力
3.3 多模态多组件生成能力
听众收益:
1. 一定程度了解AI搜索在社区场景下的应用现状
2. 了解目前主流Agent架构的基础知识及核心难点
利用AI+Data打造数据智能体,赋能汽车领域数字化跃迁
AI 技术如同强劲引擎,驱动企业从传统模式向数字化、智能化深度转型。本次演讲围绕深度结合数据和AI,打造数据智能体的关键路径,并结合汽车领域实际落地案例,说明数据智能体如何打破数据边界、释放数据价值。
演讲提纲:
1. 背景:汽车行业转型痛点与AI机遇
- 痛点:数据孤岛、价值挖掘浅、响应慢、体验升级难
- 机遇:AI驱动“数据智能体”演进(感知、认知、决策、行动)
2. 案例:汽车之家数据智能体落地
案例1:汽车销量预测及归因
- 技术点:基于传统模型精准预测销量并归因。
案例2:汽车竞争力分析
- 技术点:多维度数据支撑,自动规划分析路径、生成分析结论。
3. 实践:数据智能体核心架构
- 数据基座层:统一湖仓 (Paimon)、极速查询 (StarRocks)、数据模型、语义标注
- 智能引擎层:模型工厂 (之家仓颉 + 开源LLM)、私域知识 (领域知识 + RAG)
- 智能体服务层:智能体编排 (Dify)
- 持续进化层:反馈闭环、Know-How沉淀
4. 规划:深化智能,拓展边界
- 智能升级:多智能体协同、增强自主性、深化认知(因果推理)
听众收益:可了解数据和AI的结合思路,助力所在企业加速数字化转型,提升个人职业竞争力。
以 NoETL 指标语义层为核心打造可信、智能的 Data Agent 产品实践
当前的智能数据分析往往止步于基础问答,难以深入。我们通过企业级指标语义层筑牢根基,提供从智能问数、智能归因到交互式数据分析报告的端到端分析能力,突破Chat模式局限,让每位业务人员都能自主完成深度数据分析与洞察沉淀。
演讲提纲:
1. 引言:智能数据分析的挑战与误区
2. 指标语义层:智能数据分析的基石
3. 端到端的数据分析体系
听众收益:
- 对于决策者: 清晰理解智能数据分析的真正价值,避免陷入“ AI 就是万能的”的误区,为企业的数据战略规划提供坚实依据。
- 对于数据分析师/业务分析师: 了解如何利用指标语义层和新型工具大幅提升从数据提取到洞察产出的效率与深度,将工作重心从繁琐的数据准备转向高价值的分析推理与决策支持。
- 对于技术团队(数据/研发): 获得一个可落地的技术架构蓝图,深入理解指标语义层在 AI 数据分析体系中的核心地位。
数据智能体:自主数据处理的新范式
传统数据处理系统存在三大核心局限:封闭世界查询假设、受限的数据支持和被动式管理模式,导致其难以满足多样化的业务需求、受限的数据处理范畴以及僵化的管理机制。人工智能技术的发展为解决这些问题提供了新契机,其语义理解、推理、编排与生成等能力,为构建支持开放世界数据管理、多模态数据处理和自驱动范式的新一代数据管理系统奠定了基础。
为此,我们提出数据智能体(Data Agent),通过整合语义理解、智能推理与编排、智能生成、多智能体协同等能力自主完成各类数据处理任务。本报告将详细介绍数据智能体的关键技术与系统构建方法。
演讲提纲:
1. 数据智能体定义
2. 智能数据分析技术
3. 智能数据科学技术
4. 数据智能体案例
听众收益:
1. 什么是数据智能体
2. 数据智能体能解决的问题
3. 数据智能体的方法
落地挑战和方案重点:
1. 智能数据分析
2. 智能数据科学
从被动查询到主动治理:Data Agent在车代渠道的异常监测转型实践
在数字化转型的浪潮中,智能分析与决策技术正经历从交互式商业智能(ChatBl)向自主决策智能体(Data Agent)的范式转变。这一演进不仅代表着技术能力的升级,更体现了企业决策模式从被动响应到主动预测的根本性变革。
当前,智能分析领域面临的核心挑战在于如何突破传统工具的局限性,实现系统智能化水平和决策准确性的持续提升。特别是在车代业务场景中,异常指标的动态监测与快速修复直接影响着业务运营效率和产能提升。通过引入Data Agent技术架构,我们构建了具备自主决策能力的智能分析系统。这一技术转型为车代业务带来了显著的运营效率提升:通过智能化分析手段,实现了异常指标的快速识别与策略优化,有效促进了业务产能的持续增长。
本案例不仅验证了智能分析技术在垂直领域的应用价值,更为企业智能化转型提供了可复制的实施路径。未来,随着Data Agent技术的持续演进,智能决策系统将在更多业务场景中释放其潜在价值。
演讲提纲:
一、数字化转型中的决策范式变革
二、传统智能分析ChatBI的局限性
核心挑战:
被动响应,无法主动预警
决策延迟,制定策略慢,流程长,效率低
专业性门槛高,对数据素养有一定要求
三、Data Agent的架构与能力
Data Agent的核心能力:自主感知、智能分析、决策与执行
实践案例:车代业务中部署Data Agent,实现异常指标的快速识别,策略优化
四、量化成果
效率提升:异常发现到响应时间从“小时/天级”缩短至“分钟级”
产能提升:通过快速策略优化,有效促进了业务产能的持续增长
质性价值:将人力投入到更高价值的策略制定和创新工作中
听众收益点:
1. 清晰了解智能分析技术从ChatBI到Data Agent的演进趋势
2. 了解垂直业务领域已被验证成功的智能化转型实践框架与实施路径
3. 学习如何利用Data Agent技术解决业务指标监控滞后和决策反馈循环过长这一共性业务痛点
敦煌网聊天机器人研发应用实践
当前跨境电商行业正经历着前所未有的智能化变革,随着全球消费者对个性化、即时化购物体验需求的不断提升,AI与聊天机器人技术正在成为跨境电商平台提升运营效率、优化用户体验、提高商家竞争力的重要驱动力。
本文主要分享智能客服售前中后,自然语言搜索,智能物流路线推荐等场景下,面对多语种、多样化的用户需求,以及跨模态数据处理的挑战,如何让聊天机器人真正理解用户意图,并提供精准、高效的服务。如何借助LLM、Agent和增强检索生成RAG等前沿技术,构建更智能、更可靠的对话系统。
演讲提纲:
1. 聊天机器人在跨境电商领域的场景
2. 规划LLM及Agent整体实现方案
3. Agentic RAG优化实践
4. 应用实例分享
5. 总结与展望
听众收益:
1. 一定程度了解跨境电商领域聊天机器人场景
2. 深入了解将Agent应用于实际业务中的技术方案
3. 了解RAG核心技术点及遇到的问题
打造会思考的AI助手:芝麻企业助手的上下文工程实践
在企业智能化升级的浪潮中,传统AI助手存在上下文理解不足、对话逻辑断裂等问题,难以满足企业高效沟通与业务处理的需求。芝麻企业助手直面这一挑战,通过上下文工程的深度实践,实现AI助手从“被动应答”到“主动思考”的跨越。
团队基于企业实际业务场景的痛点,对上下文管理机制进行系统性优化与创新,构建了一套完整的上下文工程体系。通过该体系,芝麻企业助手能够精准把握对话语境,连贯处理复杂任务,有效提升服务效率与质量。
演讲提纲:
1. 上下文工程&基础实现
2. 上下文工程应用场景和落地挑战
3. 问题解决思路&工业化架构设计
4. 中期技术路线观察&商业发展趋势
听众收益:
学习并熟悉上下文工程技术的基本原理和重要性,对技术本身祛魅
了解我们在落地时遇到的坑,给自己业务中应用时避免踩到
能够在生产场景将上下文工程技术可持续的迭代起来
AI驱动下的新一代人机协作联络平台
智能营销新纪元:联想基于AI Agent与大数据模型的MarTech实战
面对营销链路繁琐,人工成本高,协同低效等困境。核心痛点是无法基于用户全生命周期旅程,进行跨渠道的自动化、个性化触达,资源浪费严重。
我们的解决方案是,在工具的基础上,自研AI用户营销平台。用户实时行为为状态,以营销动作为策略,以长期LTV(用户终身价值)为奖励,自动决策“何时、通过何渠道、推送何内容”。
落地过程中的挑战也很大,例如如何将AI能力融入传统链路中,打通数据体系,结合AI技术实现自动化,个性化。
解决办法有两个方面,一是数据治理层,建立统一ID体系(UrtlaID),实现用户实时处理与特征计算。二是在模型优化方面,引入模型的训练和学习机制,提升预测时效性和准确性。
最终的解决成效也很明显,营销自动化提效30%,减少了35%的冗余用户触达,实现了营销资源的高精度配置。
演讲提纲:
一、 业务背景:营销革新的必然之路
1. MarTech 的现状与瓶颈
- 传统 MarTech 工具栈:多渠道割裂、数据孤岛、规则依赖性强
- 核心痛点解剖:无法实现真正的“千人千面”和“实时智能决策”,导致营销资源浪费与用户体验断层
2. AI带来的范式转移
- 从规则驱动到AI驱动:介绍AI如何重塑营销链路
- 关键价值:超个性化、预测性分析、自动化运营与成本优化
3. 联想的业务挑战
- 全球性业务下的复杂用户旅程
- 海量数据存量与实时数据增量带来的处理与洞察挑战
- 对营销效率(提效)和投资回报率(降本)提升的迫切需求
二、 技术方案:构建下一代智能营销大脑
1. 核心架构设计:从平台到智能体
- 总体蓝图:介绍基于云原生与微服务架构的新一代 MarTech 平台
- 数据层:基于 Apache Flink 的实时数据计算引擎,处理用户行为流
AI层:
- 决策核心:采用强化学习框架,以用户LTV为奖励函数,训练营销决策模型
- 智能体:引入AI Agent技术,构建“虚拟营销操作员”,每个Agent负责特定任务,并能协同工作
- 模型服务:集成深度学习推荐模型、NLP、时间序列预测模型等
2. 方案选型与核心创新点
- 为什么自研?对业务定制化、数据安全性和技术主导权的考量
- 创新点:将强化学习与多智能体系统应用于大规模、实时营销决策
三、落地挑战与核心技术攻坚
1. 挑战一:数据融合与实时化
解决思路:
- 统一身份识别:打造UltraID体系,打通线上、线下、第三方数据
- 实时特征工程:利用Flink State和Redis实现用户实时画像更新与毫秒级特征抽取
2. 挑战二:模型冷启动与持续学习
解决思路:
- 模仿学习:初期通过历史营销专家数据训练模型,解决冷启动问题
- 在线学习与 A/B测试平台:模型在线上持续学习反馈,自动迭代优化,形成闭环
- 联邦学习探索:在保护用户隐私的前提下,利用多方数据优化模型
3. 挑战三:AI与传统工作流的无缝集成
解决思路:
- 低代码/无代码操作界面:让营销人员能轻松定义目标、审核策略,而不需深入代码
- 人机协同:AI提供决策建议,人工拥有最终干预权,平衡自动化与控制力
四、实践成效与量化价值
1. 效率提升:营销活动搭建与执行效率提升 30%+,大幅释放人力
2. 效果优化:减少 35% 的冗余触达,用户转化率、Engagement 率显著提升
3. 成本控制:营销资源(如短信、邮件、广告预算)实现高精度配置,浪费显著减少
4. 业务价值:实现对用户生命周期价值的最大化挖掘,直接贡献于业务增长
五、总结与未来展望
1. 核心总结:AI不是替代,是赋能,AI Agent是实现全自动、智能化营销的关键拼图
2. 未来规划:
- 技术深化:探索大语言模型在营销内容自动生成、智能客服与用户深度互动中的应用
- 范围扩展:将AI决策能力从营销领域拓展至销售、服务等全客户旅程
- 愿景:构建一个自我学习、自我优化的“自主营销系统”
听众收益点:
1. 获得前沿视角:了解AI Agent、强化学习、实时计算等前沿技术在营销领域的具体应用场景和结合方法,而非空洞的概念。
2. 借鉴实战经验:学习一个大型企业如何从0到1搭建AI驱动的MarTech平台,包括技术选型、架构设计、团队协作以及克服落地挑战的第一手经验。
3. 规避常见陷阱:通过对数据治理、模型冷启动、人机协同等挑战的深度剖析,了解项目实施中可能遇到的“坑”及其解决方案,为自己的项目保驾护航。
4. 明确投资回报:通过联想清晰的成效数据,为自己的企业引入AI营销项目提供有力的价值论证和ROI参考。
基于多Agent协作的智能营销闭环:洞察、触达与转化
在大模型技术不断演进的今天,营销正在从“自动化”走向“智能化”。传统营销往往面临三大挑战:用户洞察粗放、触达方式单一、转化效率低下。
而多Agent协作的方式,正为营销带来全新的可能性。通过将大模型能力拆解为不同的智能Agent(如标签提取、用户细分、策略生成、内容创作、效果诊断等),这些Agent能够在不同环节协同工作,形成“洞察—触达—转化”的闭环,实现真正的智能营销。
与单一模型调用不同,多Agent系统更贴合业务流程,具备可扩展性和场景适配性。实践表明,基于多Agent协作的智能营销,不仅能提升用户画像的精准度和实时性,还能在千人千面的内容生成与智能化转化跟进上带来显著效果。
本次分享将结合真实案例,探讨如何构建多Agent协作的技术架构,以及它在智能营销闭环中的落地实践与价值。
演讲提纲:
1. 开场与背景
营销智能化的趋势与痛点
大模型在营销中的机遇与挑战
多Agent协作的设计理念
Agent的角色拆解(洞察、触达、转化)
协作机制与闭环逻辑
2. 核心应用实践
洞察:标签提取Agent、客群细分Agent
触达:文案生成Agent、活动页生成Agent
转化:策略诊断Agent、智能客服Agent
3. 落地架构与实施路径
数据流与知识库支撑
多Agent协同框架
4. 价值与展望
成果指标(效率、ROI、体验)
AI Agent化营销的未来趋势
新浪微博AI应用业务提效实践
企业内部AI应用常面临两大挑战:技术门槛高导致业务人员难上手、需求响应慢;重复建设造成资源浪费、开发效率低。新浪微博打造的AIGC应用平台,通过整合企业内部资源、细化AI应用场景、深度结合业务,成功破解了这些难题,已在多个核心业务场景落地并显著提升效能。
本次分享将拆解AI应用落地的关键环节,详述问题与解决方案,无论您是技术专家、业务骨干还是管理者,都将收获可复用的企业级AI落地实战经验。
演讲提纲:
1. 行业痛点:AI应用落地门槛高、复用少、周期长
2. 解决方案:统一平台集成 Agent、MCP、低代码工作流,共同助力产研提效
3. 实战案例:多级知识与多Agent攻克多轮对话等复杂场景
4. 经验沉淀:通过业务试点、标杆案例、推广宣传逐步推动AI应用在企业落地
听众收益:
- 技术人员:了解 AI基础设施需要解决的问题,学习 MCP 工具开发以及部署过程中可能遇到的问题和解决方法。
- 业务人员:拓宽思路,将复杂问题拆解为简单任务,利用智能代理与工作流,提升工作效率。
- 管理者:获取“技术+业务”的落地方法,推动AI能力规模化落地,降低创新成本。
落地挑战和方案重点:
- 技术与业务协作鸿沟:技术人员参与业务场景讨论,业务人员参与工具需求定义。
- 工具复用率低:定期推广高复用工具与模板,树立成功案例。
- 非技术人员使用门槛高:针对新用户开展工作流编排培训,降低上手难度。
敦煌网AI编程提升研发效能实践
MCP Server基建与编排实践:重塑 AI 应用新生态
2025年是智能体“元年”,当 AI 应用开发还在为接口适配、工具壁垒所困扰时,MCP 协议正以 "AI 界 USB-C" 的姿态打破壁垒 -- 这个由 Anthropic 开源的模型上下文协议,已成为连接大模型与物理世界的通用纽带,让 OpenAI、国内云厂商等巨头纷纷入局支持。现在,贝壳正打造企业级MCP 基础设施,用创新方案破解行业痛点:零代码改造存量服务、构建统一MCP网关、搭建优质资源聚合MCP市场,更以动态工具编排技术重构了 AI 应用与 MCP Server 的交互范式。
AI 代理可在运行时动态发现并组合外部工具,使单一 MCP Server 能根据不同AI 应用的场景需求,自动适配工具描述与调用逻辑。这种差异化适配能力,打破了传统预置工具库的静态束缚,让基础设施层实现"一次部署、多场景赋能",既降低了服务复用的技术门槛,又通过动态适配释放了 AI 应用的场景创新潜力,为企业级复杂业务场景提供了高弹性的工具调用解决方案。
演讲提纲:
1. 背景介绍:AI链接新基建 MCPServer
2. 破局实践:企业级基建落地实践
a. 落地难点:安全、动态、稳定
b. 关键基建:MCP Registry和MCP网关
c. 场景落地:存量转化、安全认证、全链路观测
3. 系统协同:
a. MCP广场
b. 智能体、MCPServer和网关的关系
c. 一次部署、多智能体赋能
d. 工具描述精调
4. RAG-MCP探索:
a. 核心挑战:提示词膨胀、决策负担
b. 关键机制:向量索引、动态检索
c. 效果评测
听众收益:
- 明晰 MCP Server 建设的核心路径:系统了解企业级 MCP 基础设施的分阶段建设方案:从基础能力(开发部署、网关与注册中心搭建、零代码转换工具如 MCPBridge 的应用)到强化能力(工具编排、安全增强、市场搭建),明确每个阶段的关键举措(如MCP网关建设、注册发现机制),可直接复用至自身项目的架构设计。
- 洞察MCP Server一次部署、多场景赋能的原理:从网关架构设计深度解析Agent、MCPServer之间的关系,理解 MCPServer 的工具描述差异化配置、工具动态组合的基本原理,使单一MCP Server能根据不同 AI 应用的场景需求,自动适配工具描述与调用逻辑。
- 破解大规模工具集成的技术难题:针对 MCP Server 建设中的核心挑战(如提示词管理、Token 消耗爆炸、多 Server 协同),获取具体解决方案:既包括通过 RAG-MCP 框架的语义检索实现工具“按需调用”,减少 50% 以上的 Token 消耗;也包括通过实现动态工具编排,解决同一 Server 在不同 AI 应用中的差异化适配问题,提升系统灵活性与效率。
落地挑战和方案重点:
- 如何应对 MCPServer 爆炸增长带来的一系列的管理问题:数据安全、存量服务转化、提示词膨胀、决策负担。
- 如何让 MCPServer 实现一次部署、多场景赋能的效果,来解决不同智能体对于工具使用场景不同的诉求。
腾讯大规模强化学习训练框架的深度实践与优化
本次演讲将介绍在大规模强化学习训练框架领域的最新思考与实践。系统性的分享腾讯如何构建支持万亿参数模型训练的RL基础设施,直面在超大规模分布式训练中遇到的性能瓶颈、容灾挑战和算法协同等核心难题。演讲内容不仅涵盖关键的性能优化技术,更会揭秘框架背后的设计哲学与未来演进层面的内容。
演讲提纲:
1. 大模型时代的强化学习新挑战
RLHF如何成为大模型能力的“校准器”和“指挥棒”
万亿参数模型给RL训练带来的范式转变
2. 腾讯强化学习框架 AtlasTraining RL 现状全景图
2.1 支持的核心算法与范式:
PPO、DPO、及其在对话、游戏等场景下的变种与优化
支持离线强化学习、在线模拟交互等多种数据模式
与主流预训练框架的无缝集成方案
2.2 系统架构解析:
异构计算架构:如何协调GPU和CPU的高效协作
存储与数据流:高吞吐、低延迟的经验样本采集、存储与分发管道设计
容错与弹性调度:面对动辄数周的训练任务,如何实现断点续训、动态节点扩缩容和故障自动恢复
2.3 性能基准:
千卡/万卡集群规模下的线性加速比数据展示
单机/分布式场景下的吞吐量和资源利用率指标
与基线框架的对比性能数据
3. 关键性能优化技术深掘
3.1 通信优化:
梯度同步策略:异步更新、同步更新的权衡与混合策略
数据压缩:针对梯度、经验数据的无损/有损压缩技术
3.2 内存优化:
ZeRO-RL:借鉴ZeRO阶段3的思想,对优化器状态、梯度、参数的分布式分片存储
CPU Offloading:将经验回放池、旧策略模型等移至CPU内存或NVMe SSD,突破GPU内存墙
内存复用与显存池化:避免碎片化,高效管理动态生命周期的Tensor
3.3 训练效率与稳定性:
流水线并行:将Actor、Learner过程深度流水化,掩盖I/O和计算延迟
重要性采样与优先级回放的高效分布式实现
混合精度训练(AMP)在RL场景下的特殊调优
4. 未来规划与行业展望
多模态强化学习:框架对视频、音频等复杂状态输入的支持规划
更高效的算法支持:探索对反向传播强化学习等新范式的原生支持
AI for System:利用机器学习自身来优化调度策略和参数配置
端云一体:探索在云端训练、在边缘端部署推理智能体的协同生态
听众收益:
1. 了解工业界最强RL训练框架的技术内幕和设计取舍。
2. 获得可复用的性能优化秘籍(通信、内存、调度),提升训练效率和资源利用率,降低训练成本。
3. 把握大规模RL训练的系统架构演进趋势和未来方向,为团队的技术选型和基础设施建设提供关键决策依据。
AI时代下,数据架构的变与不变
2022年随LLM/AGI的革命性突破,数据平台迎来了第三次革命,半非结构化数据的处理能力被AI解锁,数据规模再一次触碰10倍扩展的潜力。
数据平台从业者开始面临两方向的挑战:
a.已有数据平台架构仍有诸多不足,如何改进,例如Lambda架构复杂、海量数据的处理低效。
b.新兴AI架构有诸多新的新需求,如何构建,例如半非结构化数据的组织和管理、CPU/GPU混合负载、AI-ready服务层如何构建。
因此,从业者的普遍疑问是,新一代Data+AI Infra如何设计,哪些已有架构和设计能够复用,直接实现AI效率倍增?哪些架构需要改造或者新增,以满足新的需求?
本次演讲,我将从GenAI带来新变化分析开始,论述新一代架构的设计,并探讨D+A Infra设计的变与不变。
演讲提纲:
1. 从Big Data到Big AI Data,AI带来的关键变化和业务驱动力
2. AI infra架构设计的变与不变演讲
听众收益:
1. 从架构发展的视角对比,BigData时代和AI时代架构演进
2. 了解当前AI带来的主要趋势与对Infra的挑战
3. 了解和探讨,新一代Data+AI Infra的设计思路
数据编织在企业数据 AI 落地中的应用
本次演讲将深入探讨数据编织技术作为新一代数据管理范式,如何驱动企业数据架构的智能化升级与AI化落地。重点解析其三大具体落地方案:基于语义层与NLP技术构建的ChatBI应用;与指标平台深度融合,通过查询优化与缓存策略实现多指标分析提速;以及支撑归因分析、因果推断等高级数据分析场景的前沿实践。
探讨落地过程中的关键挑战,如ChatBI的意图识别准确率、模型训练成本、及如何应用于ETL作业等技术路径。
演讲提纲:
1. 数据编织的概念,行业发展现状和趋势
2. 数据编织在企业数据架构中具体落地方案
- ChatBI 方向 —— 语义层应用
- 指标平台融合,查询提速 —— 指标融合语义层,多指标查询提速技巧
- 数据分析高级应用 —— 归因预测,因果推断
3. 行业前沿实践和未来发展预测
听众收益:
- 企业数据架构 AI 化升级过程中为什么需要数据编织
- 企业数据架构全链路,哪些环节可以使用数据编织
- 数据编织行业现状和未来演进方向
AI时代的数据新基建:下一代多模态数据湖探索与实践
随着 LLM 和多模态模型技术的飞速发展,Agent方兴未艾,如何从半结构化数据价值,更多的落地AI Agent。传统的数据湖解决方案已难以适应 AI 场景下对数据的新需求。为了应对新形势下的挑战,新一代数据湖必须解决以下多模态数据带来的关键问题:
- 数据管理:传统数据管理侧重于库表结构,而面对多模态非结构化数据,如何实现高效管理 ?
- 数据处理:如何从非结构化数据中挖掘潜在价值,如何提高 CPU+ GPU 利用率,如何使用模型高效完成非结构化数据处理 ?
- 数据存储:传统数据湖格式在非结构化数据存储方面存在局限,是否可实现全模态数据的统一湖格式存储 ?
- AI 场景支撑:多模态数据湖如何支撑 预训练、后训练、知识库、AI 搜索、智能体等场景的数据诉求?
本次演讲将分享下一代多模态数据湖探索与实践,包含新一代的技术架构,关键开源技术的更迭等。
演讲提纲:
1. 传统数据湖架构面临的挑战
-传统数据湖架构与局限性
-基础大模型和Agent对数据基建的挑战
-AI新需求对传统数据湖架构的挑战
2. 下一代面向 AI 的多模态数据湖
-AI 数据湖参考架构
-元数据与数据集
-数据处理引擎(Ray/daft)与模型
-多模态数据湖格式 Lance
3. AI 数据湖的实践案例
-模型训练场景实践
-智驾行业实践案例
-具身智能场景实践案例
4. 未来规划与展望
-未来的发展方向
-下一阶段的规划
听众收益:
- AI 时代的数据湖发生巨大变化,AI新需求驱动新一代数据基础设施和数据平台的升级
- 听众可以深入了解服务于 AI 创新的多模态数据湖新架构、新技术介绍,我们的技术优化、实践、思考和总结,探讨数据基建的创新方向和技术栈演进趋势
大模型投研多智能体的探索应用与实践
当前投研智能体面临知识碎片化、决策链路割裂、实时响应不足等核心痛点。本次演讲将系统解析大模型在投研场景的三重突破:第一,构建多智能体协同框架攻克任务拆解与知识融合难题;第二,分享买方视角下大模型在宏观预警、事件归因、报告生成等实战案例;第三,探索大模型与量化等交易决策场景的若干思考。为智能投研落地提供可复用的技术路径。
演讲提纲:
1. 投研多智能体系统架构实践与落地
- 聚焦构建核心组件:任务调度器实现智能体协同;推理规划引擎拆解复杂任务;智能体工厂支持角色子智能体(如行业/主题分析员)的自动生成与动态实例化;金融领域MCP工具箱集成语义检索、结构化数据查询引擎、认知推理工具链及结构化报告生成等专用模块。
2. 大模型驱动的多维度投研决策辅助探索
- 研发深度领域智能体:技术面分析智能体(技术指标与分析如RSI/MACD);基本面分析智能体(处理财报/业务模型);市场情绪面分析智能体(情感分析);财务估值智能体(计算DCF建模);宏观策略智能体(解析经济周期/政策)。融合多因子权重融合机制,模拟研究员视角提供归因分析与辅助投资建议。
3. 大模型赋能的量化研究闭环体系构建
- 面向量化全流程:数据加工智能体实现特征工程与清洗;因子生成与挖掘智能体应用编程/符号回归探索Alpha;模型开发智能体辅助构建/优化ML/DL策略模型;回测与评估智能体驱动历史回测引擎及绩效归因。建立自迭代优化闭环,依托强化学习框架持续反馈调优。
听众收益:
- 金融投研大模型与多智能体搭建路径与摸索
- 结合金融特色并进入深水区,如何迈向甚至投资研究
落地挑战和方案重点:
- 真实场景复杂多样,各类真实人类研究深度较高,如何真正打造终极中高级别智能研究员
- 不同行业不同类型不同职责研究员投资各异,如何真实挖掘有效信息
DatatAgent在金融服务领域的经营分析应用实践
基于大数据+Agent打造数据分析、问题诊断、策略推荐、人机对练的经营分析全链智能化解决方案,结合实际落地场景,分享在金融服务行业,如何利用AI延伸企业现有数字化能力边界,助力企业在多样化、个性化的业务运营、经营过程中构建快速、轻量的应用能力。
演讲提纲:
一、经营分析智能化探索全景
二、解决方案及应用场景
1、智能分析:传统BI到智能分析Agent,打通数据分析最后一公里
2、智能诊断:质检+环切,个性化问题诊断
3、智能策略:画像构建+话术推荐,精准业务决策
4、智能陪练:剧本生成+人机对练,辅助能力提升
三、未来展望和规划
智能测试实践,大模型助力测试与质量保障
随着百亿级参数大模型的突破性发展,软件测试领域正在经历从"规则驱动"到"认知驱动"的范式迁移。传统测试方法依赖人工编写用例、预设校验规则的质量保障体系,在面对复杂业务场景时面临着用例维护成本高、异常场景覆盖不足、多模态交互验证困难等核心挑战。
本次演讲将从智能化测试模型、大模型798测试体系、大模型性能量化评估体系等实际落地经验展开分享,重点探讨大模型与传统测试的融合架构,实现质量保障大模型测试 & 测试大模型的双重维度。
演讲提纲:
1、测试智能化转型背景与目标
- 测试智能化转型的行业必然性
- 全链路AI测试的核心价值与目标
- 人机协同的质效突破路径
2、AI大模型深度赋能测试
- 智能化测试模型架构设计
- 基于AI的需求智能“分诊”
- 多维度测试要点自动“分析”
- 质控工时智能“预测”
- 智能质量门禁的演进路径
- 质量工程的AI重构方法论
3、AI大模型的测试与评估
- 大模型798测试体系
- 大模型性能量化评估体系
4、未来研究计划与价值延伸
听众收益:
1. 获取大模型与传统测试融合的实战框架。
2. 解锁复杂系统的质量保障新维度。
大模型驱动:以应用为中心的数据治理新范式
“数据治理是智能业务的基础”,这句话已成为共识。但在真实世界的垂直行业场景中,我们仍然频繁面对“做了治理、业务照样抱怨脏数据”的尴尬现实。治理方案不是没做,而是做了没用——为什么?
本次演讲将结合讲者在医疗等领域的多年实践,从根源剖析传统数据治理的结构性困境:治理目标高度依赖于应用,而行业却倾向于追求一次治理、全局复用的“理想模型”。而大模型的到来,则打开了一条新的路径:让我们以极低的边际成本,构建面向特定应用类别的数据治理逻辑,从而实现真正以应用为中心的治理范式,为垂直行业数据智能业务提供数据保障。
这场演讲不谈AI“替代”人完成工作,而讲“放大”人的能力。我们将探讨大模型如何参与“理解需求”、“理解数据”、“生成方案”,并讨论它为何不能直接端到端完成治理,又该如何在人机协同中找到最优协同方式。最终,我们将看清,真正的行业范式转变,不是新模型,而是新方法论。
演讲提纲:
1. 现状复盘:为什么数据治理做了,业务还是在抱怨脏数据?
· “一次治理处处可用”与“一次性定制”的两个治理极端
· 越接近应用,数据就越无法复用的结构性原因
· 垂直行业(以医疗大数据为例)数据治理成果在业务复用中的挑战
· 关键转变:接受数据治理目标必须“依附”于具体应用
2. 大模型的能力和定位
· 观察/理解能力
· 可直接理解人类自然语言描述的应用需求
· 可语义级理解原始数据内容,而非停留在结构层
· 思考/行动能力
· 生成程序、脚本,进行调试、修正,实现技术链打通
· 能力放大器的定位
· 为什么不能替代人?因为责任归属与流程角色要求
· 为什么不该替代人?人类专家才是架构设计与判断的主体
· 大模型真正的优势:中立、高效、没有内部摩擦
3. 这些能力与数据治理的关系
· 数据治理出发点:始于业务需求,止于目标数据
· 大模型可参与三阶段:理解→推理→机器语言表达
· 为什么要大模型写程序?谈稳定性与效率的底线逻辑
4. 这意味着什么机遇?
· 不再是“用新工具走老路”,而是方法论的底层切换:大模型降低了应用特定治理的边际成本
· 数据智能团队能力结构将如何重构?
听众收益:
· 理解为何传统数据治理在垂直场景中难以复用,并长期陷于“治理了也没用”的困境;
· 将大模型正确定位为“能力放大器”而非“自动化替代者”,发挥其在治理中的三类关键能力;
· 认识到数据治理的出发点应回归“具体应用需求”,并借助大模型在低成本下实现针对性处理;
· 带走一套“人机协同、以应用为中心”的数据治理方法论,为未来数智团队的能力体系搭建提供思路;
· 思考如何组织数据智能团队,以适配未来的“专家+大模型”协同范式。
从团队提效到知识沉淀:AI 赋能产研全流程实践
AI 大模型技术正在深刻重塑全球产研模式,已有超过 70% 的企业开始在研发流程中引入 AI 工具,预计到 2025 年可帮助企业提升 40% 的研发成本。面对复杂业务场景、加速迭代需求和人才成本上升的三重挑战,构建 AI 赋能的产研全流程已成为企业 AI 化转型的关键。
B 端团队可通过系统性引入 AI 工具与方法,建立了从需求到交付的全链路智能协作模式,从"知识管理、工具应用、协作模式、效能评估"四个维度构建 AI 协同开发体系。实践证明,舰桥平台案例实现了38.6%的整体效能提升,B端团队每周节省7-13.5人天,显著提高了交付速度和质量。
本次分享将系统透视知乎社区生态 B 端团队的 AI 赋能产研全链路实践,重点聚焦三大核心内容:知识驱动型 AI 协同开发框架、双轨并行实践体系(在项目中实践与在 B 端团队内广泛实践)、AI 协同产研效能评估方法。通过完整的逻辑和清晰的案例,为各类技术团队提供 AI 协同开发的路径参考和经验借鉴,帮助企业在 AI 时代建立产研效能的新型竞争力。
演讲提纲:
1、AI赋能产研全流程背景与挑战
- 产研面临的效率瓶颈
- AI带来的机遇
2、AI赋能产研建设思路:全链路协同赋能策略
3、知识驱动型AI实践案例
- 项目案例:舰桥平台-单次人力投入降低38.6%,代码一次通过率92%
- 项目案例:B端团队完整实现提效7-13.5pd/周,展示知识库复利效应
4、解析成功关键要素:知识管理、场景适配、团队培养和效能评估
5、AI协同开发新范式展望
听众收益点:
- 洞悉顶层设计AI赋能产研端到端流程
- 构建统一的知识管理体系
- 建立AI应用场景评估机制
- 打造数据驱动的效能评估体系
- 平衡效率提升与质量控制的关系
从智能原生到无人公司,AI时代团队的生存指南
从智能原生的基本概念切入,通过对比智能原生与数字化实践案例,清晰梳理二者在业务模式、系统架构、数据应用与发展路径上的本质差异。演讲将系统涵盖智能原生的核心特征、四个关键维度、演进过程中面临的挑战、数据成本结构变化、智能规模效应的实现,并进一步探讨“无人公司”这一智能原生的极端形态,最终重新定位人与AI在下一代组织中的角色。
演讲提纲:
1. 什么是智能原生
2. 智能原生应用的特征
3. 四个关键维度
4. 从数字化到智能原生的挑战
5. 数据成本
6. 智能规模效应——智能原生化带来的结果
7. 智能原生的极端值:无人公司
8. 重新定位人和AI的角色
听众收益:
- 对智能原生本质与实施路径的清晰认知
- 从数字化到智能原生转型中的现实挑战与应对思路
- 如何在AI驱动下重构团队能力、规划技术架构与商业模式
开源通用多智能体JoyAgent技术解读与应用实践
当前相关开源 Agent 主要是 SDK 或者框架,用户还需基于此做进一步的开发,无法直接做到开箱即用。我们开源的 JoyAgent-JDGenie 是端到端的多 Agent 产品,对于输入的查询或者任务,可以直接回答或者解决。例如用户查询"给我做一个最近美元和黄金的走势分析",JoyAgent-Genie 可以直接给出网页版或者PPT版的报告文档。
JoyAgent-JDGenie 是一个通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智能体或者工具挂载到JoyAgent-Genie 即可。目前整体开源了智能体产品 JoyAgent-JDGenie,包括前端、后端、框架、引擎、核心子智能体(报告生成智能体、代码智能体、PPT 智能体、文件智能体等)。
演讲提纲:
1. 智能体业务场景介绍
2. 智能体相关技术解读
- 思考模式
- Memory
- 工具自进化
3. GAIA 榜单技术
听众收益:
- Agent构建
- GAIA榜单经验
落地挑战和方案重点:
- 智能体性能问题
- 智能体蒸馏技术
以智能化评测赋能数据分析:DeepInsight自动化评测集生成与实践
业务背景:在蚂蚁的数据分析智能化场景下,缺乏一个全面可信的评测集来衡量当前数据分析智能化的水位,尽管业界中文Text2SQL领域存在一些开源评测集,但无法满足蚂蚁复杂的取数分析智能化场景,因此亟需构建一套持续演进的高质量、多样化、覆盖全面的评测Benchmark。
方案选型:我们从特征选取,数据集覆盖等维度对比了业界Text2SQL领域的开源评测集,并自主设计了一套满足蚂蚁场景的自然语言取数的标注特征体系,以及基于这套标注特征的自动化评测集构建方案。
落地挑战:如何选取关键特征进行标注?如何自动化生成高质量、场景覆盖全面的评测集仓库?如何设计一套机制高效地构建并持续迭代我们的评测体系?
解决思路:自主构建一套自动化/智能化的标注和评测方案,并通过实验来验证方案的有效性。
演讲提纲:
1. 介绍当前AI+BI领域评测的现状与挑战
- 当前智能化评测的现状和特点
- 蚂蚁复杂业务场景下的特殊需求
2. 业界方案对比:
- 对比行业中/英文Text2SQL领域的开源评测集方案介绍
- 介绍当前业界评测方案的局限性
- SPIDER2:英文评测集,难度分级机制颗粒度较粗
- CSPIDER:SPIDER的翻译,但未优化中文语法习惯
3. 方案设计及优势:
- 介绍自主构建的特征标注体系和自动化评测集构建
- 介绍当前方案设计和行业其它方案对比的优势
4. 方案效果:
- 介绍方案落地的成果及对智能化效果的驱动
- 关键指标及实验结果
5. 方案迭代方向:
- 介绍智能化评测的持续探索
- 介绍未来的迭代思路
听众收益:
- 一种自然语言取数的标注方法的设计思路:对比业界其它Text2SQL的特征标注方案,了解我们方案的差异性和背后的思考。
- 一种评测集生成的自动化设计方案:了解评测集自动化设计的思路重点和难点。
理想同学智能体在智能座舱落地实践
随着大模型在智能座舱的应用不断深入,理想同学语音智能助手升级到理想同学智能体,为用户提供高效、便捷的用车、出行、娱乐、生活等智能体应用体验。
本次分享主要包含理想同学介绍、理想同学智能体架构、理想同学CUA和基于MCP、A2A协议工具使用智能体落地实践,以及数据管线构建、训练管线构建等。
听众收益:
1. 了解基于多模态大模型构建智能体,在智能座舱场景的落地实践。
2. 了解CUA(GUI-Agent)、基于自建和三方开放MCP & A2A构建智能体应用。
3. 智能体数据合成、训练管线构建。
字节生服数据治理之稳定性建设实践
在生服业务稳定性保障非常严峻且体量大,人配合难度大,协作团队多,治理工具缺乏的情况下展开系统化治理,核心措施包括建设运营体系(基线&尾节点体系、资产标签体系、资产血缘体系、资产生命周期)、全链路治体系(事前约束能力,事中巡检能力,事中应急能力,事后治理能力)、组织保障&资源保障&工具武器库保障(大盘体系、值班武器库、基线诊断武器库、治理平台)等措施,稳定性&治理效率显著提升。
演讲提纲:
1. 背景:生服业务经4年烟囱式建设,暴涨数据量稳定性保障带来了前所未有的挑战,亟需体系化、高效稳定的治理体系
2. 治理挑战:数据体量大,规范&动员人难度大,协作团队多,高效治理工具缺乏
3. 治理体系架构:整体视角介绍字节数据治理稳定性架构方案
- 组织保障:与协同团队合作共赢,展开生服内部团队协同方案,生服上游团队协同方案、平台团队协同方案并推进
- 资源保障:队列优化、使用规范管理等
- 全链路治理建设
○ 治理基座层建设:建设数据能力和高效数据产品
○ 治理执行层建设:包括事前、事中(调度前&调度中&调度后)、事后详细介绍治理能力建设等
○ 治理评估层建设:度量体系建设(北极星指标+过程指标)
- 运营保障:从基线+尾节点管理、标签管理、血缘管理、生命周期管理
- 工具保障:内部工具建设(大盘体系、值班、基线诊断、基线链路优化),外部工具建设(治理平台、计算平台)
4. 未来规划:基于大模型等新型技术进一步探索治理提效&自动化治理技术
听众收益:
- 如何协同团队内部数据同学近两百人,上游团队N千人节奏性推动数据治理
- 如何系统性+高效的保障团队核心资产万任务级的稳定产出
- 事前事中事后又有哪些异于同类公司的方法论
无数据,不AI —— 公共网络数据助力高效合规的AI研发
在迅速变化的数字时代,公共网络数据已成为推动人工智能(AI)进步的关键元素。在即将到来的演讲中,我们将深入探讨公共网络数据的定义及其对AI发展的重要性,分享Bright Data如何通过行业领先的合规实践来收集和利用这些数据,并展示成功的客户案例,以及先进的抓取策略如何为AI创新提供支持。期待您的参与,与我们一同探索如何利用网络数据驱动未来的智能科技。
演讲提纲:
1- 公共网络数据的重要性及其对AI的影响
2- Bright Data的行业领导地位以及合规数据收集
3- AI的三大基础:算法、计算和数据
4- 成功客户案例:不同行业中的应用实例
5- 现代数据管道解决方案
6- Bright Data 产品展示
面向企业级数据的多模态智能数据建设
本次演讲将着眼于企业在利用大模型时,如何跨越 ‘海量数据’ 与 ‘高效应用’ 之间的鸿沟。 现有架构中普遍存在的性能瓶颈和多模态数据的理解难题,是本次技术分享致力于解决的核心议题。通过对模型输入侧和多模态大模型内部信息传导机制的深度探索,构建了一套能够显著提升处理效率、同时确保结果高精度的智能数据建设体系。
演讲提纲:
(1)挑战:数据与算力黑洞,海量多模态数据、GPU 资源瓶颈、多源异构融合
(2)创新:Token 治理,模型白盒优化、Attention 机制裁剪、效率黄金法则
(3)落地:高效企业级推理,RAG 流程优化、规避 Query 合并陷阱、Agent 架构应用
(4)展望:智能数据未来,可执行智能、图像 Token 前沿探索
听众收益:
1、了解 推理效率提升的关键技术:熟悉如何通过输入机制的智能裁剪,实现大模型推理效率的量化飞跃,从而大幅优化 GPU 成本结构。
2、熟悉企业级架构的稳定性保障:掌握 大模型推理流程中避免并发查询陷阱的策略,以及如何利用先进推理引擎(如 VLLM 策略)确保高并发下的准确性。
3、了解模型优化的前沿思维:熟悉从多模态大模型底层机制入手进行“白盒化”优化的创新思路,有效突破传统模型调优的性能瓶颈。
4、了解智能数据落地的实践路径:熟悉该技术在多模态数据处理和核心字段抽取等企业级核心业务中的实际应用范例和未来演化方向。
小米云原生湖仓降本增效实践
小米大数据平台承载着PB级的海量数据,原有的存算一体湖仓架构在面临小文件泛滥、HDFS 运维复杂及存储成本高昂等问题时,已难以为继。为实现降本增效,我们设计并落地了一套以 JuiceFS 为统一存储底座,结合 Iceberg/Paimon/Fileset等主流数据湖格式的云原生湖仓方案。
本次分享将剖析我们如何通过该架构,解耦存算,平滑对接到多云对象存储。重点阐述我们如何攻克上云后带来的 API 调用费、热表性能、跨云带宽等新挑战,并利用缓存机制进行系统性优化。实践证明,该方案在核心业务中存储成本降低了80%,查询性能提升约 10%~50%,实现了运维效率和资源成本的双重收益。
演讲提纲:
1. 背景与挑战:传统 HDFS 湖仓的“中年危机”
- 1.1 小米大数据平台现状:PB 级数据规模下的增长焦虑
- 1.2 存算一体架构的瓶颈:运维、成本与性能的三大痛点
湖侧之痛:HDFS 小文件风暴与 NameNode 瓶颈,查询长尾效应显著
存储之痛:三副本带来的高昂存储成本与物理扩容的滞后性
2. 方案选型与架构演进:走向存算分离的云原生之路
- 2.1 为什么是云原生?存算分离的核心价值主张
- 2.2 架构核心剖析:JuiceFS on Multi-Cloud Object Storage
湖侧革新:以 JuiceFS 作为统一存储,无缝支持 Iceberg、Paimon 及 Fileset
存储侧解放:打破厂商锁定,灵活利用多云对象存储实现成本最优
- 2.3 架构全景图:小米新一代云原生湖仓架构详解
3. 落地实践与挑战攻坚:从理想到现实的“最后一公里”
- 3.1 新挑战浮现:API 调用成本、热数据访问延迟、网络带宽的三重考验
- 3.2 解法:以多级缓存为核心的性能与成本平衡术
数据缓存:保障热表核心查询性能,对齐本地 HDFS 访问速度,降低API调用费用
- 3.3 业务迁移:如何实现业务平滑、无感上云
4. 业务收益与价值衡量:降本增效成果展
- 4.1 成本收益:存储成本降低 80%
- 4.2 性能收益:查询提速 10%-50%,数据分析体验升级
- 4.3 运维收益:告别 HDFS 疑难杂症,运维效率大幅提升
5. 总结与未来展望
- 5.1 经验总结:云原生湖仓落地的三大关键要素
- 5.2 未来规划:探索基于湖仓的智能缓存预热与数据生命周期管理
听众收益:
1. 掌握云原生湖仓构建路径:学习如何基于 JuiceFS 与 Iceberg 等技术栈,构建一个高性价比、支持多云的现代化湖仓架构。
2. 攻克云上成本与性能难题:洞悉 API 调用费、热数据访问慢等“隐性”挑战,并掌握缓存平衡成本与性能的核心优化方法。
3. 借鉴大厂降本增效范本:获取小米在数据迁移、成本度量与技术选型中的第一手实战经验,为企业的数据平台提供可落地的优化蓝图。
新一代通用增量计算技术,支撑实时离线一体化的湖仓架构实践
在当前数据规模爆炸式增长的背景下,"降本增效"已成为企业数据平台建设的核心命题。然而,传统Lambda架构带来的数据冗余、计算冗余、多组件拼装等问题,使得企业总拥有成本(TCO)往往达到硬件成本的3倍以上。本演讲将深入剖析企业在"高成本、低效率"方面的四大典型场景,并分享基于通用增量计算(GIC)、新一代资源管理模式等前沿技术的最新实践案例,展示如何从Lambda架构演进到Kappa架构,实现成本降低至原来的1/3,同时大幅提升数据新鲜度和开发效率。
演讲提纲:
1. 降本增效核心问题分析
TCO成本构成:为何总成本是硬件成本的3倍以上
Lambda架构的根源性问题与四大典型场景
2. 场景一:通用增量计算(GIC)破解实时加工成本难题
Flink架构的成本困境与GIC技术原理
小红书案例:实现"三个三分之一"降本增效
3. 场景二:Virtual Cluster资源管理解决资源割裂问题
"1+N"OLAP孤岛的资源浪费
智能作业路由与弹性资源管理实践
4. 场景三:Kappa架构升级简化开发链路
从多组件Lambda到单引擎Kappa的演进
开发链路从10步简化到3步
5. 场景四:高性能引擎实现大规模数据查询突破
JSON查询加速与C++向量化引擎
TB级数据毫秒级查询实践
6. 平台架构演进总结:迈向3.0实时湖仓时代
听众收益:
成本洞察:理解企业数据平台TCO真实构成,认识降本的架构本质
技术突破:掌握通用增量计算(GIC)核心原理,打破实时性、性能、成本的"不可能三角"
架构演进:获得从Lambda到Kappa架构的实战路径与关键技术
实践案例:学习小红书、舆情风控等头部企业的降本增效方法论
未来视野:理解下一代AI-Ready数据平台的演进方向
Apache Auron(孵化阶段)社区进展与58同城应用案例
Apache Auron 是一款基于Rust和向量化技术开发的大数据计算引擎,可用于给Spark、Flink等现有的大数据引擎带来数倍的性能提升。本次演讲介绍Auron进入Apache孵化器后的一些工作进展和社区发展情况,以前Apache Auron 在58同城的落地应用情况。
演讲提纲:
1. Apache Auron 背景介绍与社区发展现状
2. Apache Auron 当前几个研究方向
- Auron + Flink
- Auron on GPU
3. Apache Auron 在58同城的应用介绍
听众收益:
1. 了解Apache Auron 项目
2. 了解如何在企业中使用Apache Auron 给大数据生产带来收益
汽车之家大模型实践——从模型训练到业务应用
本次演讲将深入探讨汽车之家在大模型领域的具体实践,从底层训练架构的选择,到业务层面的多元应用,再到推理阶段的高效实践,全方位展示大模型如何重塑汽车行业生态,为从业者提供宝贵的技术思路与实战经验。
演讲提纲:
1. 引言
汽车行业智能化转型背景
汽车之家大模型战略的意义
2. 大模型训练架构
训练架构选型考量因素
实际搭建与优化实践
3. 业务应用
脚本文案生成:基于大模型的创作流程与效果
投放效果模型预估:模型构建与精准度提升
SFT 训练、强化学习在业务中的融合应用
多模态的应用
4. 推理实践
推理框架的选型与实践成果
量化实践的策略与性能提升表现
5. 总结与展望
实践成果总结
未来大模型在汽车行业的发展方向
听众收益:
1. 深入了解汽车行业大模型实践的全流程,包括训练架构、业务应用及推理优化。
2. 掌握汽车之家在大模型训练与推理中的关键技术和创新方法,可借鉴应用于自身工作。
3. 获得对汽车行业智能化发展趋势的前瞻性洞察,提前布局应对未来挑战。
打破数据瓶颈:Alluxio 加速大模型全链路数据IO
随着模型规模和数据量的爆炸式增长,数据IO已成为制约大模型高效开发及迅速部署上生产的关键瓶颈。在训练阶段,数据读取慢导致昂贵的GPU资源大量闲置;在推理阶段,缓慢的模型文件加载和高延迟的对AI 特征库/RAG存储的数据访问,严重影响了模型服务及业务响应速度。
本次分享将深入探讨大模型数据全链路中的关键挑战,并介绍如何利用Alluxio构建高性能的数据缓存层进行从容应对。Alluxio不仅能在训练阶段为分布式任务提供内存级数据缓存速度,将GPU利用率提升至99%;更能在推理阶段加速模型文件的加载,为模型服务提供高吞吐、低延迟的数据访问,保障服务稳定与弹性伸缩。
演讲提纲:
大模型时代的核心痛点——数据IO瓶颈
Alluxio解决方案:AI数据全链路加速器
全链路加速场景深度解析
全球权威MLPerf Storage 2.0测试结果展示
听众收益:
了解如何通过一套统一的数据平台,打通大模型从数据预处理、训练到推理的全链路,最终实现开发迭代提速、计算资源节省和总拥有成本(TCO)的显著优化。
面向实战的多模态数据生成与表征技术创新
多模态表征(如CLIP)为城市治理、安防监控、智能交互等提供了强大的跨模态理解基础。图文多模态表征模型可以将文本和图片表达到同一特征空间,可以应用在电商、搜索引擎等图文互搜场景中。随着CLIP的提出,各种多模态表征的方法相继提出,我们也跟进相关的方法,同时针对在实际应用中各种短板进行提升。针对训练数据的噪声和冗余特性,我们提出ALIP和CLIP-CID。
为了构建更大规模的训练数据集,我们提出RealSyn 100M。结合Transformer并行化训练和RNN高效推理的特点,我们提出RWKV-CLIP。为了提升文本和图像模态的表达能力,我们提出了DeGLA和UniME。
演讲提纲:
挑战与机遇:
核心需求:跨模态理解、场景感知、实时决策
CLIP等技术的潜力与局限
文搜图应用
攻坚数据瓶颈
稀缺的高质量配对数据限制模型上限—> RealSyn 100M
数据重写和去冗余
连接应用,数据优化如何提升城市监控中的目标检索精度/跨摄像头追踪效果
多模态表征模型
高效模型RWKV-CLIP
否定词表达DeGLA
多模态大模型增强表征 UniME
实战检验
核心案例深度解析
听众收益:
- 洞察空间智能核心场景下多模态基础模型面临的关键挑战与解决思路
- 掌握提升多模态表征数据质量与规模的前沿方法(ALIP/CLIP-CID/RealSyn),及多模态表征训练中数据如何提升模型能力
- 了解面向空间智能应用的多模态表征模型的设计理念与技术细节
- 获得来自复杂行为识别等真实场景的宝贵技术落地经验
时空智能助力具身智能在业务中落地
面对复杂开放环境中机器人系统的可靠性挑战,传统方案在空间理解、故障预防和多智能体协作方面存在系统性瓶颈。行业迫切需要从感知、推理到监控的端到端智能解决方案。
我们构建了完整的技术栈:基础层通过RoboBrain 2.0异构架构模型(7B轻量级+32B全功能版本)统一视觉-语言理解能力;感知层利用RoboRefer实现精确三维空间指向推理,突破传统VLM在复杂3D场景理解的局限性;系统层借助RoboOS层次化框架解决跨具身适应和多智能体协作难题。
关键突破在于故障预防机制:我们创新性地提出Code-as-Monitor范式,将开放集故障检测统一为时空约束满足问题,通过VLM生成的约束代码实现反应式故障识别和主动式故障预防的双重保障。这一机制将传统被动响应转变为智能预警,显著提升系统鲁棒性。
实践验证表明,RoboBrain 2.0在空间和时间基准测试中达到业界领先水平;Code-as-Monitor在真实机器人任务中实现了高效的开放集故障检测和预防,为智能机器人系统的产业化部署提供了从感知到监控的完整技术保障。
演讲提纲:
一、业务背景分析
1.1 行业痛点识别
复杂开放环境下机器人可靠性挑战
传统VLM在3D空间理解的局限性
多智能体协作的系统性瓶颈
故障检测的被动响应模式问题
1.2 市场需求驱动
智能制造对精确空间操作的需求
服务机器人对安全可靠性的要求
多机器人协作场景的爆发式增长
从实验室到产业化的技术鸿沟
二、方案选型设计
2.1 整体架构思路
全栈技术路线:感知→推理→执行→监控
四大核心技术模块的协同设计理念
2.2 核心技术模块详解
基础模型层:RoboBrain 2.0
异构架构设计:7B轻量级 vs 32B全功能
统一视觉-语言理解能力
支撑上层应用的基础能力
感知理解层:RoboRefer
三维空间指向推理技术突破
专用深度编码器集成
复杂3D场景理解能力提升
系统执行层:RoboOS
层次化具身框架设计
跨具身适应性解决方案
多智能体协作机制
监控保障层:Code-as-Monitor
约束感知视觉编程范式
反应式+主动式双重故障检测
开放集故障预防机制
三、落地挑战分析
3.1 技术挑战
大模型训练的计算资源需求
多模态数据融合的复杂性
实时性与准确性的平衡
跨域泛化能力的局限
3.2 工程挑战
异构系统集成的复杂性
大规模部署的稳定性保障
不同具身平台的适配问题
故障检测的误报与漏报平衡
3.3 产业化挑战
从实验室到生产环境的适配
成本控制与性能的权衡
安全合规与创新速度的平衡
四、未来规划展望
4.1 技术演进方向
模型轻量化:边缘计算友好的模型压缩
能力扩展:支持更多模态和任务类型
自主学习:在线学习和持续优化能力
4.2 应用场景拓展
工业4.0:智能制造全流程覆盖
服务机器人:家庭和公共服务场景
特种机器人:极端环境作业能力
4.3 开放讨论
技术路线选择的思考
产业化过程中的关键要素
未来发展趋势预判
听众收益:
1. 全栈技术架构设计认知升级
深入理解具身智能系统的完整技术栈设计思维,掌握从基础模型、感知理解、系统执行到监控保障的四层架构协同原理。获得大规模AI系统工程化的实践经验,特别是异构架构设计(7B+32B双版本)在不同场景下的差异化部署策略,为类似复杂系统设计提供可复制的方法论。
2. 故障预防范式的创新思维转变
学习从传统被动故障处理向主动故障预防的范式转换,理解Code-as-Monitor将故障检测抽象为时空约束满足问题的创新思路。掌握通过约束代码生成实现反应式和主动式双重保障的技术路径,为提升系统可靠性提供全新的解决思维框架。
多模态数据存储、治理、开发管理平台实现AI-Ready的落地实践
AI时代企业数字化转型面临新的挑战,AI客服、智慧门店、多智能体等需要对多模态数据进行统一治理,难度非常大,海信集团正在面临这种挑战。
之前针对结构化数据建设的大数据系统已不能满足多模态数据的统一治理,基于内部的业务挑战,大数据平台基于云原生技术自研新一代多模态数据湖,进一步自研多模态数据开发与治理平台,与AI平台打通,为模型训练和AI应用直接提供AI-Ready 数据,已支撑集团AI客服和9大领域智能体上线。
演讲提纲:
1. 海信数智化转型进展,面临的挑战
2. 多模态数据管理行业现状,需解决的问题
- 行业现状与共性挑战
- 模态壁垒加剧数据孤岛
- AI-Ready数据供给断裂
- 性能与成本难以平衡
- 行业技术方案对比与局限
3. 平台架构与重要组件的原理实现
- 整体架构:云原生多模态数据湖驱动AI闭环
- 核心组件技术细节
组件1:多模态数据湖存储引擎
组件2:智能治理中枢
组件3:AI-Ready接口层
4. 落地场景与经验+演示
5. 未来规划
听众收益:
- 了解AI时代数转的新路径,行业趋势和对数据的新要求,
- 了解支撑集团级大规模多模态数据管理平台的实现原理与实践
- 应用落地过程中的方式方法与路径
阿里云DLF 3.0:AI时代的全模态湖仓管理平台新发展
DLF-3.0全新升级为面向 AI的智能湖仓管理平台,该平台深度融合了数据湖(Data Lake)和数据仓库(Data Warehouse)的优势,集成企业级Paimon存储,面向AI构建了一个灵活、高效、智能的数据生态系统,帮助企业实现数据的全生命周期管理,并充分释放数据在AI驱动决策中的潜力。
Flavius:原生图数据湖仓的架构设计与落地实践
现有图数据库大多专注于OLTP事务处理,难以支撑图数据在BI、AI特征工程、GraphRAG等偏OLAP场景下的高效分析。Kasma自研的Flavius引擎是业内首个基于湖仓一体架构打造的图OLAP数据仓库,原生支持列式存储、向量化计算、Time Travel、多租户资源隔离,并兼容开放数据格式(如Parquet),支持高效批量数据流转,无需依赖外部ETL工具。
Flavius可支撑海量图数据的高性能查询与子图分析,并采用计算存储分离架构,查询/存储节点均可按需弹性扩缩容。同时,其为GraphRAG等AI场景提供原生支持,整合自研原创的GraphRAG算法,提升语义检索质量,加速大语言模型对复杂关联知识的检索与推理。我们将在演讲中系统介绍Flavius的架构设计、查询优化技术以及在金融风控、游戏社交等领域的落地实践,展示如何打通“图存储—图分析—图AI”的湖仓闭环,释放图数据的真正全局价值。
演讲提纲:
动机和定位:为什么我们需要一款专注于OLAP的图数据库?
市场缺口:OLAP图场景的"无人区"
我们的突破:为OLAP图场景而生
- 图数据管理在OLTP与OLAP场景上的区别
- Flavius架构设计
- 功能介绍
- 性能分析
应用场景举例
听众收益:
什么是图数据湖仓,为什么需要它?
Flavius图数据湖仓的架构设计优势
图数据湖仓有哪些应用场景
快手实时入湖如何助力BI & AI场景架构升级
多模态助力家政业务体验升级
随着人工智能技术的快速发展,家政业务正迎来一场深层次的数字化变革。演讲将围绕AI技术在家政领域的创新应用展开探讨:
1、AI换装技术如何在家政服务形象标准化中发挥作用;
2、AI视频简历让家政人员展示更出彩;
3、智能短视频模板通过技术平权实现"千人千面"的高效生产;
4、互动型数字人技术在家政直播中的应用演进。
演讲将深入解析这些技术创新如何重构家政行业的服务形态与用户体验,为从业者提供前瞻性的发展思考。
演讲提纲:
1、AI换装在家政行业的应用
- 阿姨着装为何难标准化
- AI换装的历次撞南墙
- AI换装对家政行业的重塑
2、AI视频简历:家政阿姨的数字化跃进
- 传统简历形式无法满足用户的浏览需求
- 借助AI展示更真实的阿姨
- 万物皆可视频化的思考
3、短视频模板——随心一点,千人千面
- 真正的“一键成片”
- 短视频模板在AI时代的技术平权
- AI技术重新组合后的潜力展望
4、互动型数字人直播重塑用户体验
- 数字人的探索历程
- 如何做到更真实数字人互动
- 数字人技术的展望
听众收益:
- 洞察趋势:了解AI技术如何重塑家政行业,把握数字化转型的前沿方向
- 实用方案:获取可落地的AI应用案例,优化企业服务展示与运营效率
- 创新思维:激发对"AI+家政"融合发展的新思考,开拓业务增长点
- 决策参考:获得技术选型与升级的策略建议,降低创新试错成本
大模型增强用户体验与客户服务——平安客户服务的Al进阶之路
在AI与大模型技术爆发时代,客户需求从基础功能跃迁至情感体验。平安新金科利用大模型驱动客户服务数智化升级,解决个性化定制、服务效果提升和隐私平衡问题,为行业提供可复制路径。揭示从“功能满足”到“体验深耕”的变革,如何通过大模型实现“AnyWhere AnyTime AnyThing”服务。
演讲提纲:
一、背景:客户服务演变与大模型机遇
1. 需求升级:从功能到情感
客户需求沿马斯洛层次上移,新金科从适老化服务向全阶段管家式服务转型,凸显个性化需求增长。
2. 技术驱动:渠道与能力革新
通信技术(APP、视频等)拓宽服务渠道;Al技术从辅人期向人机共生演进。
二、大模型赋能实践:核心应用场景从+AI到AI+
1. AI嵌入期
理念:AI替代高频率,标准化的简单服务。
实践:新金科智能语音机器人已达V3.0阶段,从“机械响应“到情感共鸣”,解决率提升至xx%;
通过CS模型动态匹配策略满足日益复杂的客户需求,已覆盖xx个AI场景,Al覆盖率达xx%。
2. Al辅人期
理念:AI替代向复杂服务延伸,辅助人工端各环节提效。
实践:线上帮人+线下育人8大最佳实践场景为客户服务提效率、提百产、降风险。
3. 人机共生期
理念:人与AI深度协同,重塑作业范式。
实践:在健康险理赔场景探索端到端理赔机器人服务,驱动S2/S3场景替代;
全面构建Al赋能体系,系统化推进服专家的知识资产,专业经验和业务能力向大模型的知识迁移,实现服务效能的指数级提升。
三、挑战与解决方案:平衡创新与隐私
1. 需求复杂性与Al适配
挑战:客户需求多样化(如消极进线上升),传统模式不足。
方案:大模型动态策略(如CS模型重构),覆盖多客群,提升解决率与情感交互。
2. 技术落地与体验斗衡
挑战:数据治理难题(权限严、元数据缺失);高并发要求。
方案:全链路优化(轨迹打通、模型校准);大模型算力支撑快速响应。
3. 隐私保护与创新平衡
挑战:大模型应用中数据隐私风险;金融监管要求。
方案:数据合规风控;四层出话机制探索。
四、成果与未来:从升级到深耕
1. 现阶段成果
2. 未来方向
听众收益点:
了解如何利用大模型提升智能客服和个性化用户体验,解决客户实际问题,提升满意度,同时平衡创新与隐私保护
OmniUser:基于大模型的用户理解新范式
用户理解与建模是推荐系统的核心内容之一,传统范式的用户理解主要从序列和协同出发,这一建模范式在抖音推荐系统、特别是UGC推荐系统中存在高热噪声、推理缺失、精细化程度不足等问题。
我们提出OmniUser:以百亿参数LLM为核心,在Test-Time Scaling+SFT+RLHF框架下融合内容理解先验,生成可解释身份、兴趣白盒画像与隐式黑盒表征,在多个推荐场景下获得实际业务收益。
演讲提纲:
1. 背景 抖音UGC业务背景与现有方案
2. 方案 基于大模型的用户理解
a. 白盒用户画像
i. 用户身份画像
ii. 用户兴趣画像
b. 黑盒用户表征
3. 落地应用现状
4. 未来展望
听众收益:
1. LLM如何应用于推荐系统用户理解,并取得业务收益
2. 推荐场景下如何提升LLM推理能力
落地挑战和方案重点:
1. LLM在推荐协同知识方面不足(包括用户知识和物品知识),影响推荐效果与效率
2. LLM推理链路建设,平衡成本与效果
AI 驱动招聘变革:从模糊需求到精准匹配的实战之路
在 AI 技术快速渗透各行各业的背景下,招聘行业的逻辑正在被重塑:企业对人才的需求更精准、求职者对职业匹配的效率要求更高。此时,招聘平台的核心任务不再是简单的 “信息撮合”,而是要成为 “AI 驱动的人才价值连接器”,通过技术重构招聘全链条,同时兼顾效率、公平与长期价值。
本次主要分享我们如何基于AI基础,重构招聘流程,面对用户需求模糊,人岗错配,流程迟滞等问题,如何更精准的理解双边需求,用AI助力平台提供“精准匹配”,“高效撮合”的能力,打破信息偏差,从而招聘平台解决 “效率、精准、公平” 的问题。
演讲提纲:
1. 行业现状与核心痛点:招聘链路的效率与体验困局
a. 求职者的 “三重壁垒”(人岗错配,流程迟滞,个性化不足)
b. 招聘方的 “效率瓶颈”
2. 大模型的破局价值:重构招聘全链路的核心能力
a. 全链路智能化:从 “人找机会” 到 “机会找人” 的范式升级
b. 技术赋能的核心价值
3. 核心技术与实践路径:从 “能做”到 “做好”的落地逻辑
a. Agent 智能体:招聘流程的 “自动化中枢”
b. LLM 微调与适配:让模型 “懂招聘” 的关键
c. 多模态融合:突破文本局限的体验升级
4. 未来展望:招聘智能化的演进方向
a. 技术层面:从 “工具” 到 “伙伴” 的进化
b. 行业影响:重新定义 “人与机会的连接”
5. 总结:大模型不是 “替代者”,而是 “赋能者”
听众收益点:
- 深入理解痛点与解法:清晰了解招聘行业在 AI 时代面临的 核心痛点 (需求模糊、错配、迟滞) 及 基于大模型和 Agent 技术的系统性、实战化解决方案。
- 收获实战经验与启发:通过 多个具体应用案例 及其背后的 技术选型、架构思路和挑战克服经验,获得在自己的领域应用类似技术的启发。
- 掌握关键结合点:深刻理解传统搜推技术如何与大模型能力有效融合与升级,提升匹配系统的智能化水平,看到具体的技术路径和效果数据。
- 洞察未来趋势:了解 AI 在招聘领域应用的前沿方向、潜在挑战及未来可能性。
海管家 Smart ERP 的 Agentic 实践之路
国际物流,一个支撑全球贸易运转的30万亿美元市场,正站在一个深刻变革的十字路口。令人震撼的是:一个集装箱从上海到洛杉矶,海上运输仅需15天,但整个业务节点的流转、相关文档处理却要20天。这个行业30-40%的成本来自"看不见的办公室劳动"——无数从业者每天重复着查询、计算、协调、处理异常的工作,成为效率提升的最大瓶颈。
海管家作为中国物流数字化的领军企业,深刻洞察到这一痛点背后的本质:传统工作流引擎的"静态流程"模式已无法适应复杂多变的物流业务需求。我们创新性地提出了WOL-APL-EVAL"动静结合"架构,实现了从固化流程到目标导向的根本性转变。
这不仅仅是技术的升级,更是流程治理理念的革新。当AI具备了在规范框架内自适应规划和执行的能力时,物流行业长期存在的效率与灵活性矛盾终于有了突破性的解决方案。
演讲提纲:
1. 物流行业的"效率悖论":为什么万亿市场还在用Excel?
2. AI 技术突破的历史性机遇:从静态流程到智能协同
a. 大语言模型:从理解到推理的能力跃迁
b. 智能代理:从被动执行到自适应规划的转变
c. 物流行业的技术适配性:标准化与个性化并存的复杂场景
3. 「WOL-APL-EVAL」架构实践:动静结合的智能流程治理
a. WOL(流程治理):抓大放小,控制顶层流程范式和关键节点
b. APL(自适应规划):目标导向,在治理框架内自主规划和执行
c. EVAL(评估机制):效果驱动,持续评估目标完成度和风险控制
4. 实战验证:从概念到价值的转化
听众收益:
- 深入理解 Workflow、AI Workflow、Agentic Workflow概念及其异同
- 理解从"人找信息"到"信息找人"的交互模式转变,设计更智能的用户体验
- 学习AI技术在复杂业务场景中的适用性判断,学会识别高价值应用场景
- 学习如何在技术创新和业务价值之间找到最佳平衡点
中国移动聚智智能体平台驱动数智化转型实战
在大模型飞速发展的今天,智能体技术已成为解决大模型落地难题、推动企业数智化转型的关键引擎。
本次分享将简述智能体技术的核心概念,重点聚焦中国移动自主研发的聚智智能体平台,并结合该平台分享智能体应用赋能业务场景的实践经验。聚智智能体平台,采用“低代码平台”+“高代码SDK”双轮驱动框架,目前已深度赋能移动内部营销、办公、运维等多个复杂ToB场景,并在30+省专公司推广应用,为业务创新注入强大动力。
演讲提纲:
1. 智能体技术背景
- 大模型能力的爆发式增长与“最后一公里”落地难题
- 智能体核心定义与概念、运行与构建案例
- 智能体研发痛点:应用开发门槛高、开发效率低、场景落地周期长、定制化成本高、跨领域应用及动态环境适应能力缺乏、成本难以控制
2. 聚智智能体平台深度解析
- 中国移动人工智能总体蓝图
- 平台产品定位:让每个人都成为大模型时代AI应用的智造者
- 平台产品优势:解决大模型落地的“最后一公里”
- 平台功能架构与模块功能介绍
- 零代码、低成本快速开发智能体
- 低代码平台+高代码SDK的“双轮驱动”智能体开发新范式
- 智能体生态汇聚与共享
- 平台功能优势:通过通用组件与专用工具提供坚实底座,依托统一运维机制实现高效管理;支持高低代码混合开发模式,灵活构建单智能体或多智能体应用;通过智能体超市与工具超市推动生态共享,加速智能落地与创新迭代。
3. 智能应用案例分享:赋能30+省专公司的实践
听众收益:
1. 深入了解中国移动聚智智能体平台的企业级设计理念和“双轮驱动”核心技术架构。
2. 获得从0到1打造智能体应用的方法论和实践路径,了解如何通过平台工具应对落地挑战。
3. 通过对真实业务案例的剖析,深度理解智能体技术如何在不同复杂场景中实现价值闭环,并获得可借鉴的经验。
4. 获取关于融合高/低代码开发模式、推动智能体规模化落地的前瞻性思路和解决方案。
AI虚拟投研部:组建金融战场的私人军队
随着大模型与智能体技术的快速发展,越来越多的优秀产品和应用技术在金融垂类场景上涌现出来。在过去一两年中,包括蚂蚁在内的探索者主要专注于如何用大模型和多智能体技术来辅助金融分析师提高日常工作效率,帮助分析师们搜集信息、记录会议、初步分析和报告撰写。但在今年,蚂蚁投研团队开始将精力投入扩大智能体的决策范围,让AI感知市场、产出观点、配置资产、产出交易信号。
本演讲将与大家分享蚂蚁投研技术团队近几年在投研智能体技术上的探索与沉淀,同时介绍目前在建设中的AI虚拟投研部的最新工作。
演讲提纲:
1. 蚂蚁投研团队建设并落地的投研智能体介绍
2. 传统金融机构的投研部构成与工作内容介绍
3. AI虚拟投研部的方案设计与落地实践
4. 智能投资组合的实盘业绩与未来展望
听众收益:
通过本次分享,听众可以获取蚂蚁投研技术团队在智能体搭建、工具构建以及大模型应用效果的提高方面的实践经验,同时能完整地了解在垂直专业领域上大模型和多智能体技术解决方案的落地案例,以及金融投研与AI相结合的前沿探索。
始于IDE方寸,达于无所不至——IntelliJ IDE 构建 AI Agent 工程平台的探索
将介绍 JetBrains 如何将其 AI Assistant 与 Junie 从 IDE 中的 AI插件,逐步演进为集成在 IntelliJ IDE 核心的智能体平台。IntelliJ IDE 平台一直以来都是 JetBrains 最重要的资产,IDE 的各种核心功能价值都依赖于这一坚实基础。为了确保能在 AI Coding 浪潮下更快更好地构建 IDE 内的原生 AI 体验,JetBrains 将 Coding Agent 的构筑能力集成到了 IntelliJ 平台的基础架构之中,也就是所谓的“Agent 工程平台”。
Agent 工程平台将成为 IntelliJ IDE 中的一等公民,而不再是依托于插件的独立实现。除了 JetBrains 自有的 Junie,我们还在探索将 Claude Code,Codex,Amazon Q 等拥有不同长处的 Agent 深度集成到 IDE 中,抹平各工具间的交互体验差距(如diff工具、单测窗口、变更记录、运行环境配置等),并探索如何将 IntelliJ 提升代码质量的核心能力(静态分析、重构功能)接入不同的 Agent 中。
本次演讲侧重于此次重大升级所涉及的核心技术挑战与实现,包括对 Kotlin 库和 IntelliJ SDK 的深度改造,以及在生产中引入、应用并迭代 Kotlin Koog 智能体框架,并对 Agent 能力进行评估的实践经验。
演讲提纲:
- Coding Agent 形态之争——IDE or not?
- 从AI 插件过渡到 AI IDE 进化之路——IntelliJ or not?
- Agent 平台工程化——为产品的功能与实现,设计不同的切面
- Agent 工程平台的效益——聚合 AI Coding 功能,切分产品形态
听众收益:
- 从开发工具的使用者,转换到开发工具设计的视角,了解日常使用的 AI Coding 工具的构建方式
- 洞察未来 AI Coding 工具的平台化趋势,为工具评估提供新视角
- 了解前沿的智能体框架的设计与应用实例
- 了解 JetBrains 在大规模改造既有工具基础设施的经验和教训
抖音推荐下一代生成式推荐系统
抖音推荐系统迭代已久,水位很高,通过传统DLRM的方式进一步提升性能变得越来越困难。对此我们设计了新的范式舍弃了大量的手工特征和特征工程,采用了类似于语言LLM 的纯序列化表示方式表示用户行为,并通过Scale Up大幅度提升了现有推荐模型的能力。
演讲提纲:
1. 抖音推荐业务背景,现有问题
2. 方案:
- 模型框架
- 数据组织
- 吞吐优化
- 推理方案
3. 未来展望
听众收益:
1. LLM时代推荐范式思考。
2. 推荐系统Scale Up之路
挚文集团推荐工程架构从草莽时代到生成式推荐的进阶之路
重点介绍挚文集团推荐工程架构从早期起步阶段逐步演进至生成式推荐的完整发展历程。
首先回顾推荐系统经历的三个重要发展阶段,随后深入拆解推荐中台化方案如何通过全流程配置化实现业务逻辑与模型结构的有效解耦,显著提升算法研发与全团队迭代效率。在AI基础设施层面,将介绍超大规模稀疏模型实时训练体系的关键技术,以及如何结合大语言模型突破推理性能瓶颈。进一步聚焦生成式推荐的落地实践,探讨LLM技术在推荐流程中的控制与对齐机制,以及中台化架构如何支持生成式方案的快速验证与迭代。最后,我将分享团队在工程落地中面临的核心挑战与应对策略,包括全动态化系统的故障定位、性能优化与非标需求支持,以及生成式模型推理效率的提升路径。
通过本次分享,帮助大家深入了解推荐系统架构的演进方法论、在有限资源下提升研发效能的技术手段,以及生成式AI在推荐场景下的应用实践与未来方向。
演讲提纲:
1、挚文集团推荐工程发展三阶段
2、拆解从原始到推荐中台化方案解决的关键问题
3、讲解生成式方案的探索以及中台化方案和生成式LLM结合落地方案
4、给出团队下一步工程痛点
听众收益:
- 对于工程架构,如何做到问题解构,通过架构设计做到方案逐步升级
- 如何在有效人力条件下,通过技术手段提升团队迭代效率
- 在AI场景下,如何快速落地生成式方案验证以及提升
抖音内容理解大模型在推荐的应用
演讲提纲:
一、背景
1. 抖音的背景:体裁众多,业务流程众多
2. 很早年的时代,推荐曾基于标签等内容理解能力进行推荐
3. 前几年,内容理解能力作为推荐模型的补充,在线上也有较多的应用
4. 当前大模型的能力逐步提升,我们可以更多地应用大模型实现推荐工作
5. 两个主要的方向
- 利用LLM实现可解释推荐
- 结合LLM做内容表征
二、LLM可解释推荐
背景,当前有较多团队实现了类似的工作
1. 用户兴趣总结&泛化(预期这部分会写一个公开技术报告)
2. 用户兴趣匹配(预期这部分会写一个公开技术报告)
3. 线上实验
三、LLM内容表征
背景
1. 内容表征效果评估
2. 内容表征能力建设,生成&表征联合建模(预期这部分会写一个公开技术报告)
3. 线上实验
听众收益:
- 了解内容理解在推荐中的应用点,价值和挑战点
- 了解大模型对内容理解的加成
- 激发观众对未来推荐架构的畅想
以数据为中心的大模型行业发展演进路径
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
阿里云OpenLake:AI时代的全模态、多引擎、一体化解决方案
微软十年,曾任微软必应新闻搜索搜索引擎团队负责人,曾负责MS多个事业部的不同产品相关工作。阿里八年,曾任阿里集团搜推广事业群数据平台+效能/质量团队负责人,阿里集团研发效能事业部负责人,阿里云无影事业部负责人,曾负责 DataWorks 1.0、2.0、3.0,PAI 1.0、2.0,达摩盘3.0 等核心产品。
大模型驱动的推荐系统新范式:vivo的实战经验与未来展望
深耕大规模机器学习/推荐系统/计算广告/计算引擎/大模型等领域,全面负责vivo互联网内容推荐、商业变现、应用与游戏分发等多种业务场景,取得突出业务增益,为5亿vivo用户提供极致的智能服务。
从深度学习到大模型:技术趋势与产业实践
总体负责开源深度学习平台飞桨(PaddlePaddle)的产品和技术研发,主要研究方向包括自然语言处理、深度学习等,相关成果在百度产品中广泛应用。马艳军在ACL等权威会议、期刊发表论文20余篇,多次担任顶级国际会议的Area Chair等,并曾获2015年度国家科技进步二等奖。2018年被评为“北京青年榜样·时代楷模”。
AI浪潮下的投资洞察:趋势、潜力与决策逻辑
作为多维资本董事,曾文波先生长期聚焦AI科技、具身智能、智能制造等领域的投融资与资本运作,曾主导多个AI相关产业链项目的融资与战略规划。
神策分析在BMW集团的应用实践
宝马集团技术经理,参与数据仓库、用户画像、数据看板等内部系统的研发。
基于知识库构建数据Agent,及其在CDP中的运营实践
清华大学计算机系本科和研究生。百度资深研发工程师,先后参与了百度日志平台、用户数据仓库、用户画像等内部大数据系统的研发,是 Hadoop 等大数据系统在国内最早一批的使用者。后共同参与创建了神策数据,担任 CTO 职位,负责管理公司的技术团队。
广告业务中大模型特征入模建设应用实践
AI Agent 在物流业务场景的应用
货拉拉算法专家,聚焦大车业务的AI Agent落地,提升平台运营效率。前京东、美团算法专家,专注用算法驱动业务增长。
知识工程体系建设:大模型精细化广告营销应用实践
现任京东广告算法部算法工程师,主要负责广告算法数据体系建设。加入京东之前,曾在Teradata工作多年,在大规模分布式计算、机器学习、精准营销领域有较为深入的实践。
大模型在得物社区内容搜索场景落地实践
得物社区AI搜索负责人,长期负责内容理解在搜推、审核、创作等场景落地,目前负责大模型跟搜索系统结合,提升相关性、质量等目标,以及探索下一代搜索形态,“AI搜索”跟社区的有效结合。
AI搜索的技术效能:从“检索”到 “洞察”
阿里云计算平台-AI搜索产品负责人。在阿里云计算平台负责 Elasticsearch&OpenSearch 等AI搜索系列产品工作,擅长数据&AI搜索产品全链路能力构建, 从0到1完整搭建大数据产品商业化团队。拥有十多年大数据&AI相关产品与解决方案经验,曾在多家知名IT与互联网企业主导大数据与企业搜索产品研发及数据产品商业化落地。
基于LLM淘工厂智能服务托管实战
2014年入阿里巴巴,长期深耕互联网电商领域的商业化、搜索、智能客服等核心业务方向。现任淘天集团淘工厂商业化&智能服务算法负责人,聚焦于借助AI技术,帮助商家经营效率和用户体验提升。
快手AI搜索实践:基于LLM的检索规划与生成优化实战
北京大学自然语言处理方向博士,曾在百度、腾讯负责任务式对话理解、长文本理解相关工作,2023年入职快手以来主要负责大模型在搜索中的创新落地探索,包括智能问答卡、AI搜等。
AI搜索在小红书的落地实践
博士毕业于北京理工大学。在 ICLR、AAAI、ACL、EMNLP、NAACL 等机器学习/自然语言处理领域会议/期刊上发表数篇论文。主要研究方向为大语言模型推理评测蒸馏、生成式检索、开放域对话生成等。现负责小红书社区搜索精排 LTR,原负责向量召回(长尾和个性化)。
利用AI+Data打造数据智能体,赋能汽车领域数字化跃迁
汽车之家计算平台负责人,专注构建高效稳定的大数据与 AI 基座,深度融合 AI 技术挖掘数据价值,推动数据资产向业务价值转化,为智能决策与创新应用提供强韧技术支撑。
以 NoETL 指标语义层为核心打造可信、智能的 Data Agent 产品实践
数据智能体:自主数据处理的新范式
从被动查询到主动治理:Data Agent在车代渠道的异常监测转型实践
敦煌网聊天机器人研发应用实践
10+年算法研发经验,目前主要负责LLM、聊天机器人、智能体、视频、数字人等技术在业务场景落地。
打造会思考的AI助手:芝麻企业助手的上下文工程实践
专注构建可控可靠的智能体解决方案和上下文工程的架构研究与应用实践,融合工程与算法,积极探索智能体自进化能力的落地路径。
AI驱动下的新一代人机协作联络平台
拥有15+ 年IT从业经验,深耕网络通信、大数据、AI等技术方向。已将科技赋能至信托、银行、消金等多个行业,提升业务质效。
智能营销新纪元:联想基于AI Agent与大数据模型的MarTech实战
主导了联想MarTech平台和用户运营系统的建设,以及在AI领域的探索和落地。通过AI重塑营销链路,通过AI提升营销效果,通过AI优化人工成本,追求通过技术精细化地解决业务问题。
基于多Agent协作的智能营销闭环:洞察、触达与转化
十多年互联网金融大厂数据分析、产品工作经验,深耕数据领域;出版2本销售破万册的数据领域专著,拥有3个数据采集分析专利,运营未来数据官社群和网站;政(大学生村官)、企(数据从业者)、研(在职研究生)、学(校外导师)四段独特跨界成长经历。
新浪微博AI应用业务提效实践
具有丰富的互联网平台研发经验,擅长分布式系统设计、微服务架构、实时计算等技术领域,对业务架构、技术架构、数据架构等方面有深入研究和实践经验。
敦煌网AI编程提升研发效能实践
MBA,二十年IT从老兵,十年外企,十年互联网技术管理经验。
MCP Server基建与编排实践:重塑 AI 应用新生态
目前主要聚焦于大数据和人工智能领域的基础设施建设,致力于通过容器化手段推动AI技术的落地和创新。技术层面专注于:云原生与AI原生的落地实践:探索并实践前沿技术,以提升系统性能和智能化水平。机器学习平台:维护并优化我们自研的机器学习平台,确保其稳定性、安全性要和易用性。个人热衷于技术创新,并且相信通过不断的学习与实践,能够为用户带来更加智能和高效的解决方案。
腾讯大规模强化学习训练框架的深度实践与优化
拥有10年左右的高性能计算、深度学习领域经验, 先后就职于Intel,微软,腾讯公司,是 ONNX,TF-ONNX,ONNXRuntime 等深度学习框架的开发者,深度参与微软/腾讯公司的大模型预训练、强化训练。
AI时代下,数据架构的变与不变
云器科技联合创始人兼 CTO,曾任阿里巴巴 P10 研究员,主导了阿里云飞天大数据平台二代研发及落地,曾于微软云计算和企业事业部工作近十年,浙江省科技进步一等奖获得者。
数据编织在企业数据 AI 落地中的应用
目前任职于理想汽车,负责 Data Copilot 模型工程研发落地。曾在百度负责企业智能 ChatBI ,端日志中台,百家号数据等大数据研发方向。有多年模型工程研发,数仓研发,数据治理的行业经验。
AI时代的数据新基建:下一代多模态数据湖探索与实践
字节火山引擎数据平台产品总监,拥有10多年大数据ToB产品商业化经验,从0到1孵化了火山引擎EMR、AI数据湖服务等火山引擎大数据产品。
智能体革命:数据平台如何重塑保险业未来
平安财产险数据服务平台组负责人,负责数据产品平台、搜索推荐、客户策略平台、共同资源AI团队。在大模型Agent平台建设以及数据平台赋能智能体有丰富经验。
大模型投研多智能体的探索应用与实践
拥有丰富的互联网算法从业经验,现天弘基金大模型方向算法专家,主要负责研发“弘小助智能助手”,并荣获2023年国家金融科技发展奖三等奖。主要负责大模型基础研发与金融场景的创新与落地。
DatatAgent在金融服务领域的经营分析应用实践
平安新金科资深数据分析师,主要负责数据中台建设及数据智能化应用,在企业数据分析、智能数据应用、数据治理方面具备实战经验。
智能测试实践,大模型助力测试与质量保障
从业质量领域18余年,主要负责质量风险管控、稳定性保障、效能度量、质量运营等质量领域相关工作和业务落地。
大模型驱动:以应用为中心的数据治理新范式
清华大学创新领军工程博士。近七年在医渡云负责"临床-科研-循证"数据智能技术研发,现创立医疗数智项目“安心备诊”。主持研发的大数据平台和临床辅助决策系统已在大量医院落地应用;合作发表论文10余篇,参与多项科技部及省市重点研发项目;获7项发明专利授权,其中1项获2022年中国专利优秀奖。
从团队提效到知识沉淀:AI 赋能产研全流程实践
负责社区运营研发,包含:舰桥平台团队-正向引导立标杆、内容安全治理团队-负向治理守底线、风控反作弊反爬平台团队-流量安全打黑产、客服平台团队、爬虫团队等运营研发团队。自 2018 年加入知乎后,在社区和社交业务领域,担任高级研发与业务架构师。2021 年担任用户理解和数据赋能组的研发 Leader,带领团队从 0 到 1 搭建了实时数据基础架构和相关业务功能,并完成 DMP 和用户理解的整合。2022 年带领团队从 0 到 1 建设了一站式内容&用户&创作者管理、运营、分析平台 - 知乎舰桥平台,后逐渐整合并升级了活动、客服和教育 B 端。现合并了安全、治理、风控等方向的团队,负责社区运营研发。专注于平台化、产品化的解决各运营场景的赋能和提效问题。
从智能原生到无人公司,AI时代团队的生存指南
此前曾带产研团队负责小爱同学、小度在家、北京冬奥会后台等的关键部分,作为公司首席运营官主导2亿以上融资并辅助完成每年2亿以上收入并盈利,署名发明专利100+。现作为架构师主导新型多智能体系统(MAS:Multi-agent System)的设计和实现。北京大学国家发展研究院企业家AI启航班教师。
开源通用多智能体JoyAgent技术解读与应用实践
现在京东集团智能体平台算法,主要研究方向包括大模型、智能体、知识图谱、对话系统等。已在ACL、EMNLP、SIGIR、AAAI、COLING、MM会议及期刊发表20多篇论文,获得NLPCC2018 Outstanding Paper Award。在CCKS2018 KBQA竞赛、FewCLUE、Quac、GAIA比赛或者榜单获得冠亚军。主导了JoyAgent开源项目,当前以已获6.2k star。
以智能化评测赋能数据分析:DeepInsight自动化评测集生成与实践
蚂蚁集团产品经理,蚂蚁数据分析平台评测负责人,主导DI智能化的评测体系构建,及评测集开源项目建设。蚂蚁数据分析平台产品专家,负责DI数据准备,报表等核心模块的智能化产品建设。已获得1项国家专利授权,并有3篇专利申请中。
理想同学智能体在智能座舱落地实践
吉林大学硕士毕业,理想汽车空间AI语言算法部负责人,研究方向大模型、大模型智能体、强化学习等。之前在OPPO、雅虎、去哪儿网等公司有丰富的对话、推荐、搜索和广告方面的算法经验。
字节生服数据治理之稳定性建设实践
毕业于电子科技大学,拥有11年大数据经验,现任字节跳动生活服务数据治理负责人。曾就职于字节、阿里、京东等头部企业,多次主导规模化数据体系建设,涵盖离线/实时数仓、全域数据治理等核心领域,并探索数据湖、大模型等前沿技术落地。大厂期间多次获得公司级高绩效及核心奖项,主导的治理项目收益显著。
无数据,不AI —— 公共网络数据助力高效合规的AI研发
负责亚太地区客户技术支持,案例探索,以及系统对接。有10年以上IT从业经验,在网络数据收集,自然语言处理等技术方面有深度的行业经验。
面向企业级数据的多模态智能数据建设
专注多模态与大模型研究,涵盖图文与视频理解,探索高效推理与稀疏化机制,积累丰富科研与应用经验。
小米云原生湖仓降本增效实践
曾任职京东,长期深耕大数据存储领域,聚焦 HDFS、JuiceFS 等核心技术栈的研发与实践;当前主要负责大数据存储架构中「存算分离」模式的设计、落地与优化。
硕士毕业于中国科学院计算技术研究所,现任小米数据湖研发工程师,负责数据湖 Iceberg,Paimon,元数据湖 Gravitino 等开发工作。曾就职于百度,是 Apache IoTDB 和 Apache TsFile PMC 成员。
新一代通用增量计算技术,支撑实时离线一体化的湖仓架构实践
大数据领域多年从业者,2017年开始在阿里巴巴的计算平台事业部工作,后加入云器科技;完整参与过 MaxCompute 及云器 Lakehouse 等多套大数据产品的研发/生产/交付/应用全流程工作。
Apache Auron(孵化阶段)社区进展与58同城应用案例
现任Apache Auron PPMC,曾就职于多家一线互联网公司,在大数据领域有十多年工作经验。
汽车之家大模型实践——从模型训练到业务应用
曾任职京东、腾讯算法工程师,深耕推荐系统与大模型训练。现于汽车之家负责算法平台搭建,精通模型训练推理技术,实战经验丰富。
打破数据瓶颈:Alluxio 加速大模型全链路数据IO
加入 Alluxio 之前曾在知名互联网公司担任数据架构开发工程师,主要从事大数据架构与 AI 存储架构的设计、研发及运维工作,技术领域涵盖 HDFS、Flink 与 Alluxio 等核心系统。
面向实战的多模态数据生成与表征技术创新
专注于计算机视觉与多模态学习研究与实践,成果发表于CVPR等顶级会议(如Glint360K, PartialFC, Unicom, MLCD),Glint360K和PartialFC已经被合并至insightface(最受关注的人脸识别repo,8.3k star),Glint360K已经被京东、oneflow、中科院自动化所等公司和科研机构使用。基于间隔Softmax训练得到的视觉预训练模型Glint-MVT可支撑分类检测等基础视觉任务,也可以提升多模态大模型的效果,对应的参考分割模型达到了SOTA。在格灵深瞳,领导团队成功将先进视觉与多模态技术应用于大规模城市级空间智能系统,实现:
- 高效城市级人员动态管理: 构建支持两万路摄像头输入的实时人脸/人体聚档系统,支撑城市级安防应用。
- 跨时空身份关联: 开发同亲缘跨年龄人脸比对技术,协助警方成功寻亲。
- 复杂行为理解: 在智慧体育、金融场景中实现高精度人体行为与事件识别(如倒地检测达万分之一误报下99%召回率),并在OpenFAD2023、SkatingVerse等空间动作识别竞赛中夺冠。致力于推动多模态大模型在垂直领域的落地与创新。
时空智能助力具身智能在业务中落地
迟程,北京智源人工智能研究院研究员,博士毕业于中国科学院大学,曾任智行者科技有限公司感知负责人。长期聚焦多模态感知与具身智能方向,研究成果发表于NeurIPS、TPAMI等顶级会议和期刊上,谷歌引用超过4000次。并荣获多项国际竞赛奖项,展现出深厚的技术积累与工程能力。
多模态数据存储、治理、开发管理平台实现AI-Ready的落地实践
数据库和大数据技术爱好者,负责聚好看云平台、数据库、大数据、业务中台、运维与测试,海信集团数智化转型核心成员。
阿里云DLF 3.0:AI时代的全模态湖仓管理平台新发展
阿里云智能集团计算平台事业部DLF产品负责人
Flavius:原生图数据湖仓的架构设计与落地实践
香港中文大学计算机系博士,带领团队自研基于湖仓一体架构的分析型图数据库、基于GraphRAG的智能体平台。曾任职字节跳动Infra ByteGraph团队Tech Leader;主导开发的图数据存储/计算/训练系统广泛服务于字节内部核心应用。在计算机系统领域共发表国际顶会论文20余篇,引用率1000+。
快手实时入湖如何助力BI & AI场景架构升级
多模态助力家政业务体验升级
目前就职于58集团本地服务事业群,负责技术创新方向。研究生毕业于哈尔滨工业大学,曾就职于腾讯。近两年主要负责多模态在本地服务业务中的应用,主导了AI生图、AI视频及数字人项目,推动了AI技术在家政业务的落地。同时,作为技术创新负责人,带领团队持续跟进AIGC前沿技术与发展方向,致力于技术创新赋能本地服务行业。
大模型增强用户体验与客户服务——平安客户服务的Al进阶之路
平安新金科大数据算法工程师,负责统筹、推动平安客户服务AI赋能与数字化升级。在客服文本挖掘、智能客服系统搭建方面具备丰富实战经验。
OmniUser:基于大模型的用户理解新范式
硕士毕业于中科院自动化所,现任字节跳动算法工程师。曾于微信、微软、滴滴、上海AiLab等实习,从事大模型、推荐系统、强化学习等领域并在 EMNLP、NeurIPS、ICRA等顶会发表多篇论文,并获MSRA “明日之星” 等荣誉。
AI 驱动招聘变革:从模糊需求到精准匹配的实战之路
智联招聘算法负责人,工作涵盖搜推算法,内容理解等算法的研发。
海管家 Smart ERP 的 Agentic 实践之路
先后参与并主持京津港国际物流SaaS平台、金山软件西山居娱乐游戏平台以及阿里钉钉移动医疗服务等项目。现任海管家的研发负责人,专注于云原生技术架构、智能化系统设计和AI技术在物流行业的深度应用。在容器集群与运行时、服务观测与治理、持续交付等云原生领域具有丰富的产品架构经验,致力于推动物流行业的智能化变革。
中国移动聚智智能体平台驱动数智化转型实战
中国移动首批“金种子计划”入选者,2025年度北京市科学技术协会“高创计划”青年人才托举工程入选人才。目前主要负责中国移动聚智智能体平台的架构设计与核心技术研发,主导构建了覆盖营销、办公、运维等核心业务场景的30余项智能体应用解决方案,成功赋能超过30余家省专公司;至今已发表学术论文14篇,提交专利19项,荣获各类科技奖项10余项,持续在人工智能与产业融合领域深耕创新。
AI虚拟投研部:组建金融战场的私人军队
蚂蚁财富投研技术架构师、投研智能化应用架构师,曾先后任职于阿里集团淘宝技术部、蚂蚁财富投研团队。长期致力于投研技术领域、大模型应用技术、以及探索将智能体技术与金融研究进行有机结合的实践路径。
始于IDE方寸,达于无所不至——IntelliJ IDE 构建 AI Agent 工程平台的探索
主要负责Rider相关研发支撑与 JetBrains AI 技术推广。他的工作涵盖了 AI Assistant、Junie 等 AI 工具与 IntelliJ IDE 的集成,以及 GameDev、YouTrack、TeamCity 的行业整合解决方案。他擅长为各种开发场景设计高效的应对方法,与一线开发者积极交流,帮助他们解决技术难题,并通过分享实践经验,助力优化开发人员的效能与体验。
抖音推荐下一代生成式推荐系统
现就职字节跳动,从事抖音推荐大模型算法研究工作。曾就职/实习于腾讯,阿里巴巴,网易等多家大厂,从事NLP/搜索/推荐等领域。曾获多项国家级奖项,在天池/CCF等比赛中多次斩获Top名次,曾主持并参与研发服务于北京冬奥会的多项国家重点研发计划项目。
挚文集团推荐工程架构从草莽时代到生成式推荐的进阶之路
曾在腾讯、滴滴任职,当前在挚文集团计算智能部担任工程团队负责人。主要在推荐系统架构、AI Infra 方面有长时间投入,曾在系统架构师大会分享陌陌推荐场景的 Rank 架构最佳实践。
抖音内容理解大模型在推荐的应用
recsys-examples:面向生成式推荐训练和推理优化的最佳实践
2020年加入NVIDIA Devtech 团队,专注于推荐系统训练与推理优化。目前是 recsys-examples 开源项目的负责人。之前是 HugeCTR embedding 的主要开发者之一。