使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2 天沉浸式学习交流 | 15+前沿分论坛 | 60+真实应用案例
科技日新月异,大数据与人工智能等技术的迅猛发展正引领各行各业迈向变革的新纪元。数据量的激增与计算能力的跃升,成就了大模型技术的崛起,为人工智能的飞跃式发展注入了新的动能,数据与智能双向深度融合彰显出无限潜力。
经历了初期的狂热,业界对大模型的看法已逐渐回归理性。技术终究是工具,其价值在于落地应用与创造实际效益。大模型的进一步发展对数据科学理论与数据工程技术提出了日益迫切的需求;数据在大模型产业发展中扮演着日益重要的角色。大模型与大数据如何双向奔赴、如何深度融合、如何赋能产业,成为了当前大数据与人工智能研发的关键议题。
基于此,本次“数据融百业,智能创未来”线下大会汇聚业界顶尖专家学者与行业领袖,共同研讨大数据、大模型等技术的最新动态与应用实践。我们期待通过这一平台,激发知识交流与思想碰撞,发掘创新与合作契机,共同探索数据智能推动行业数字化转型升级与高质量发展的路径。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
在大数据、人工智能领域拥有超过20年研发经验。目前负责阿里云大数据和机器学习平台,支撑达摩院、淘宝、菜鸟等大数据存储、计算、分析和机器学习的需求,同时服务于数以万计的云上客户。
曾担任NewsBreak工程总负责人,负责AI系统、推荐、广告等业务,并成功推动NewsBreak技术及商业化转型。
曾担任微软搜索与人工智能事业部工程副总裁和全球杰出工程师,带领团队研发搜索、对象存储、大数据计算、深度学习平台和框架,支撑微软Bing、Office365、Azure、大语言模型研究等业务。创建和领导了大规模深度学习团队DeepSpeed,并发布了当时最大的语言模型170亿参数的Turing-NLG。
纽约大学计算机硕士学位、中国科学技术大学计算机和经济管理双学位。
阿里云EMR研发团队负责人,资深技术专家,Apache Flink & HBase PMC Member,Apache软件基金会Member。
芝麻企业信用技术负责人,负责整体技术工作。之前就职于网商银行,Uber美国以及PayPal,在综合金融系统,Uber增长平台,基础架构有多年经验。获得加州大学默塞德分校硕士,从事计算机视觉相关研究。
数新智能创始人&CEO,中国计算机学会大数据专委会执委、数据治理与发展技术委员会执委员,哈工大计算学部浙江校友会会长。
云器科技联合创始人兼 CTO,曾任阿里巴巴 P10 研究员,主导了阿里云飞天大数据平台二代研发及落地,曾于微软云计算和企业事业部工作近十年,浙江省科技进步一等奖获得者。
数据库和大数据技术爱好者,负责聚好看云平台、数据库、大数据、业务中台、运维与测试,海信集团数智化转型核心成员。
个人介绍:周卫林,Aloudata(大应科技)创始人 & CEO,曾任蚂蚁集团研究员(P10)、蚂蚁集团数据平台部总经理,拥有 20 余年大数据领域从业经验,是国内最早一批数据仓库先行者。他曾深度参与并主导了阿里/蚂蚁集团从传统数仓体系到数据智能体系的数据技术演进过程,全面支撑了蚂蚁集团从支付工具到数字生活平台的升级,横向推动了整个蚂蚁集团业务数据化、智能化水平的提升。除此之外,他还是多个有影响力的数据工具类产品的主要缔造者,并由此孵化出多个进入 Gartner、Forrester 领导者象限的阿里云拳头产品。
个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到3100余次,H-index达到29。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,自然语言处理专委会秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
众安保险数据产品与数据基建团队负责人,兼任众安金融数据中心负责人。拥有多年数据领域产品研发管理经验,深耕金融行业,专注于AI工程化、流批一体架构与金融业务场景的深度融合。在DataOps体系搭建、智能决策引擎开发等领域具备丰富实战经验。
中国平安人寿保险股份有限公司架构与数据管理团队总经理,大数据标准技术推进委员会首批数据中台专家、香蜜湖金融科技创新特征与趋势报告(2021)编写组成员;毕业于四川大学,2001 年加入平安,拥有 20 余年保险信息化系统建设和数据管理经验,参与并部分主导公司数字化转型战略,主导寿险数据技术迭代升级,从传统数仓向数据集市、大数据平台、数据中台持续演进,带领团队历获金保奖”卓越保险科技数据中台奖(2023)、“金信通“金融科技创新应用案例特色奖(2022)、香蜜湖金融科技创新奖优秀项目奖(2019)、深圳市金融创新奖一等奖(2016)、二等奖(2023)等。
喜马拉雅智能引擎与分发部负责人,负责搜索、推荐与AI产品创新。关注搜推、大模型应用与生成式推荐等方向,曾就职于美团、阿里等公司。
深耕软件与数据领域二十年,聚焦大数据治理与智能计算,推动数据资产化、智能化,实现数据价值的可持续释放。
中兴通讯数字化专家,长期深耕企业数智化转型与AI应用落地领域。致力于打造可复制、可推广的企业AI实践范式。
13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。
20余年通信运营商/物联网/互联网平台建设经验;牵头多个国家省部级项目设计落地;目前专注于公司集团化/智能化能力建设工作。
2011-2020.6在百度凤巢模型团队从事广告推荐算法;2020.7月加入vivo,负责vivo互联网内容推荐算法。
企业级本体工程:从Palantir方法论到中国实践 | Data+AI 技术与应用创新 | Agentic RAG:从检索增强到自主决策 |
|
|
|
| 非结构化数据工程:文档/图像/视频的AI化处理 | Data+AI 在金融领域的实践 | AI for Data:数据治理智能化升级 |
|
|
|
| Agent Ready数据架构:下一代数据基础设施 | AI驱动的数据开发与分析一体化 | Agentic AI开发框架与工具链 |
|
|
|
大模型应用成本优化实战 | LLM+研发效能:从代码生成到智能研发 | AI搜索:从关键词到智能对话 |
|
|
|
| Agent应用安全与可控性 | Data+AI在新消费的实践 | 上下文工程——大模型应用落地的核心工程实践 |
|
|
|
负责数据开发和管理平台Dataverse、实时计算平台、AB实验平台、RedBI分析平台和UBA 用户行为分析平台的技术研发工作,《极客时间》数据中台实战课作者,订阅量超过 3W+,拥有13年互联网数据开发和管理的实践经验,最近一年专注于Data+AI 数据平台的构建实践。
太平洋保险集团云首席专家兼AI中台负责人,具备十多年的系统开发维护,云产品架构设计、解决方案设计经验,多年金融单位、互联网云厂商工作经验,做为总架主导过多家大型银行私有云/金融云、某保险集团混合云/专有云建设、城商行云化转型等项目建设;目前主要负责集团云计算云原生、AI中台能力建设、业务双活/单元化体系建设,资源混部、智能运维、混沌工程等课题。
在互联网行业深耕16年,曾在DDD领域驱动设计,公司级系统稳定性建设以及企业技术文化建设方面有较多的研究、落地实践与文字输出。25年以来创建去哪儿网 QUNAR AI Lab,聚焦于 AI toC端应用实践,尤其是旅游OTA垂类的AI to C端应用实践。
负责哈啰的搜推广/NLP/CV相关算法。曾就职于网易和阿里巴巴。十多年搜推广算法老兵。主导过搜推广(自动化营销、互动式广告引擎、视频与内容推荐)多个创业业务算法体系、基础算法(端智能 、智能客服、视觉核查平台) 等 0-100阶段多个不同方向。目前关注大模型和AIGC在哈啰内外应用。
连续2届担任腾讯前端技术委员会委员,现担任腾讯低代码开源协同 Oteam PMC,腾讯云架构师上海理事会理事。目前带领团队在全链路AI Coding领域进行实践落地,有丰富的AIGC特别是AI Coding,AI+低代码开发领域的提效落地实践经验。此外,在低代码相关领域实践多年,曾参与信通院低代码无代码标准制定、主导IEEE,大湾区,公司内低代码相关标准编制,在阿里 D2 、GIAC、QCon、ArchSummit、QEcon等大会上进行多次出品和演讲工作。
十六年互联网行业技术架构、云技术体系建设老兵,早期在互联网甲方经历了从刀耕火种到业务井喷下的自动化技术建设及落地;先后就职UCloud、阿里云,经历了云技术快速发展的关键时刻,有丰富的云上技术经验,长期专注行业技术架构、技术保障及新技术应用,聚焦零售、游戏、教育、企业、大模型、具身智能、智能驾驶等行业客户,重心大模型各垂类智能体工程化实现、后训练加速、AI Infra等全栈AI实践;追求以“技术洞见未来”,有幸成为千行百业AI技术变革的一员。先后分享著作有《重保护航——保障云上巅峰时刻》、《游戏行业技术服务与实践》、《云上社交行业白皮书》、《云上奥运技术实践体系》、《AI卓越架构与技术服务白皮书》等。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
吕航飞现在负责某一线互联网公司现有系统智能化架构演进。历任百度商用CRM SAAS系统及座舱语音智能体架构师,SAP某业务团队SaaS技术负责人。擅长复杂系统落地及重构,AI Agent落地。
长期负责公司的技术战略与数字化运营创新,在数字化运营方面,通过建立三套“KY”体系(KYC、KYP、KYI)来精准匹配用户与金融产品,并推动服务模式从“以产品为中心”转向“以用户为中心”。在技术应用上,朱益盛主导了多项创新实践,如开发智能“巡检机器人”前置发现APP使用问题,以及利用AI、大数据和知识图谱技术实现用户需求预测和风险预警。同时,他注重数据安全与隐私保护,强调所有数字化探索均在合规前提下进行。
先后在Alibaba、Splunk、eBay等大型跨国企业工作。现就职于eBay担任架构师,专注于电商用户行为处理和分析领域,以及数据平台化技术工作。
核心专长:AI搜索全链路架构,大模型RAG应用,搜推算法工程,跨国团队管理。
此前曾担任字节跳动架构师,负责建设大模型RAG服务,支撑Cici(DAU 130w+)、豆包等AI产品。也曾担任Klarna智能搜推负责人,从0到1搭建全球支付平台搜推体系,Home Feeds点击率提升1.5倍 。
更早前担任网易云音乐技术负责人:带领团队自研分布式检索引擎nsearch,实现业务人效提升12倍。最早的工作经历是阿里巴巴技术专家,负责盒马搜索架构及OpenSearch平台化建设。
在过去的十几年里,一直深耕在搜索与推荐技术的最前线。从早期在阿里巴巴参与OpenSearch平台的0-1建设,到在网易云音乐自研高性能分布式检索引擎“nsearch”,再到后来走向全球,在瑞典独角兽Klarna和字节跳动探索海外市场的搜推技术与大模型落地,亲历了搜索技术从传统的倒排索引到如今AI驱动的RAG与多模态检索的完整演进。
多年算法综合领域落地从业经验,目前负责蚂蚁企业信用部算法工作。
负责B站的大数据实时/离线计算平台、OLAP平台、存储系统、资源调度、平台工程等系统的建设工作。有15年以上的大数据架构和平台产品建设经验,曾在大众点评、阿里云、携程负责大数据平台和架构组件的研发工作,对分布式计算,分布式存储、搜索引擎,数据湖,数据治理,大数据平台产品和系统架构等方面有丰富的研发和实践经验,目前专注于AI+大数据在企业内的落地和实践。
长期深耕于大数据及人工智能领域,积累了丰富的数据平台建设和架构设计实践经验。现任阿里国际 AI Business 大模型数据、评估负责人,专注于大语言模型及多模态大模型数据研发、模型评估工作,致力于推动数据与AI技术的迭代融合与创新。重点攻坚大型模型对应的大规模、高质量数据处理技术及优化,大模型在业务领域表现的自动化评估技术。在此之前,曾担任阿里云行业大型模型数据研发负责人、阿里云政务及医疗行业数据负责人、蚂蚁金服国际数据平台架构师。
深耕大数据领域十年,拥有丰富的数据平台建设与治理经验。对数据架构、血缘治理有深刻理解,是资深的数据技术实践者与分享者。
长期深耕大数据领域,擅长大数据应用平台建设和AI for Data 和 Data for AI 数据平台体系建设和落地,目前专注Data+AI,帮助业务提升数据赋能效率,驱动业务决策。
主导构建了B站商业数仓“智能化底座”,通过Neo4j知识图谱与 MCP 标准化感知协议,打通了 LLM 与万级数仓资产的通信闭环。目前专注于需求交付工作流(prd2sql)的智能化重构,在万级任务规模下实现了高准确率的人机协同开发实践。
太平洋保险集团云首席专家兼AI中台负责人,具备十多年的系统开发维护,云产品架构设计、解决方案设计经验,多年金融单位、互联网云厂商工作经验,做为总架主导过多家大型银行私有云/金融云、某保险集团混合云/专有云建设、城商行云化转型等项目建设;目前主要负责集团云计算云原生、AI中台能力建设、业务双活/单元化体系建设,资源混部、智能运维、混沌工程等课题。
平安财产险数据服务平台组负责人,负责数据产品平台、搜索推荐、客户策略平台、共同资源AI团队。在大模型Agent平台建设以及数据平台赋能智能体有丰富经验。
网易云音乐推荐算法专家,有多年一线推荐算法和大模型应用开发经历,对大模型结合推荐系统有深入了解和实际落地经验。
张进目前是阿里集团1688 买家 Agentic AI团队负责人。具有多年NLP,多模态,强化学习等AI相关领域的研究工作,多年AI创业经历,当前负责1688的AI原生应用以及AI创新产品的研发。
电子科技大学硕士毕业,曾服务于中通服,TeraData 等知名公司。现就职于平安科技数据管理部门,任技术平台组负责人(高级经理),曾负责引领集团数据中台的规划、建设,现负责集团数据技术管理运营工作以及集团数据管理相关平台的建设。
范文栋 CAMEL-AI.org核心工程师,都柏林大学统计学硕士。自2024年4月加入团队并主导开源CAMEL多智能体框架的开发和优化。在任期间,CAMEL和OWL两个开源项目Github破万。
擅长数据建模、机器学习、自然语言处理(NLP)和生成式AI。曾任巴斯夫AI工程师,为销售,供应链,生产等多个业务领域构建AI解决方案,曾主导团队的第一个生成式AI项目并取得专利。曾在爱尔兰中央统计局开发NLP驱动的职业分类系统,实现人口普查数据处理自动化;曾参与平安科技知识图谱项目,构建企业级产业链数据库。具备从AI模型研发到应用部署的完整技术能力。
恒生电子研究院AI首席技术专家,AI产品部部长,高工,浙江省人工智能学院博导,浙江师范大学、浙江理工大学兼职教授。主要研究领域包括自然语言处理、大模型、OCR等,并拥有超过20多项AI专利和论文,赋能投顾、客服、运营、风控、投行等场景。
资深算法专家,上海市高级工程师,国际注册特许工程师;专注大模型算法研究与应用,在金融科技、通信、医疗等业务场景成功落地多个商业项目;接受环球时报、人民日报、中国商务新闻网等知名媒体采访,发表多篇科技署名文章、政策解读及学术论文,国内与国际发明授权专利 10 多项。
具有15年金融科技从业经验,工作范围包含软件开发、测试、运维、架构师、项目经理、交付经理、产品经理等;服务过汇丰科技、广汽汽车金融、小鹏融资租赁、恒生银行等企业。
在互联网行业深耕16年,曾在DDD领域驱动设计,公司级系统稳定性建设以及企业技术文化建设方面有较多的研究、落地实践与文字输出。25年以来创建去哪儿网 QUNAR AI Lab,聚焦于 AI toC端应用实践,尤其是旅游OTA垂类的AI to C端应用实践。
金融大模型:架构变革、工程实践与Agent智能体的前沿探索
大模型不仅推动了技术范式的颠覆,更在金融这一高合规、高安全、高复杂性的领域催生了深层次的架构变革。本次演讲将从技术演进、工程落地与生态融合三个维度,系统解析金融大模型的核心挑战与突破路径。
首先,深入探讨金融场景下大模型在安全性、精准性、实时性方面的特殊要求,以及恒生电子如何通过“领域知识增强架构”与“合规对齐技术”构建可信的金融大模型底座。其次,结合国内外典型案例,剖析大模型在智能投研、合规风控、动态客服等场景中的工程化实践,重点讲解“RAG+Fine-tuning”混合技术路径与“低延迟推理优化”方案。最后,聚焦于大模型驱动的“金融Agent智能体”生态,分享我们在多模态交互、复杂任务拆解、插件安全治理方面的前沿探索,并展望未来“金融原生AI系统”的可能形态。
演讲提纲:
1. 金融大模型的技术挑战与架构创新
- 金融场景的“三高”特性(高合规、高安全、高精准)对大模型提出的特殊要求
- 恒生金融大模型架构解析:领域知识注入、合规对齐训练、MoE专家模型集成
- 关键技术突破:基于RAG的实时知识更新、轻量化微调(P-Tuning、LoRA)、对抗性安全训练
2. 场景落地:从技术到工程的跨越
- 智能投研与研报生成:多源信息融合、逻辑一致性校验、合规风险词过滤
- 动态风控与合规监控:实时事件推理、异常模式检测、可解释性报告生成
- 新一代智能客服:多轮对话决策、情绪识别与安抚、复杂业务链路的智能导航
- 核心系统赋能:代码生成辅助、文档自动化、业务流程再造
3. 金融大模型插件与Agent智能体的深度实践
- 插件与通用场景的本质差异:数据隔离、权限管控、审计溯源
- 金融Agent智能体框架:任务规划、工具调用、自主学习和协同机制
- 典型案例:智能投顾Agent、监管报送Agent、跨系统业务流程自动化Agent
4. 未来展望:金融原生AI系统的演进路径
- 趋势预判:从小模型集群到超大模型、从单模态到多模态决策、从辅助到自主智能
- 金融原生AI系统核心特征:实时学习、自主进化、全链路可解释、强安全内生
- 开放问题与前瞻:量子计算对加密与推理的影响、脑机接口与金融交互范式变革
听众收益点:
1. 理解金融大模型在“数据安全、模型合规、输出精准”等方面的核心差异与关键技术保障。
2. 掌握金融场景中适合大模型原生的“高知识密度、强逻辑推理、动态交互”类任务的分析框架。
3. 深入了解金融大模型插件与Agent在“权限隔离、风险可控、审计追溯”等方面的特殊设计与工程实现。
4. 获得对未来“金融原生AI系统”在架构、安全、交互及伦理层面的前瞻性洞察与趋势判断。
超越通用大模型:金融领域的高效适配与数据价值挖掘
聚焦大模型在金融科技场景下的应用挑战,以及针对这些挑战所做的探索与实践。
我们碰到的应用挑战主要有:
1. 垂域知识的获取:领域知识的获取和整理与萃取,成本较大,很多情况下,知识是碎片的,相互矛盾,有时甚至是口口相传,并没有记录下来。
2. 大模型应用的成本较高:一个好的推理模型,token的成本和延时较高,成为落地的障碍;
3. 效果评估挑战:效果评估依赖测试数据与标签,挑战往往在于测试数据有时是没有的(x,y都没有);另一个是生成式任务的评价一直是一个难题,比如策略推荐。
针对上述,我们做了针对性的实践:
1. 知识与数据:我们通过设计知识逆向提取、数据合成等方法,来降低知识获取的难度和成本,分别应用在客服和电销业务场景;
2. 针对大模型成本问题,我们采用APO、模型蒸馏与后训练的方式,大幅提升小模型的表现,以替代大参数量的大模型;
3. 在部署优化侧,我们通过对比不同训练方法在部署端的性价比,倒退训练模型的方法,进一步采用量化、投机采样等方法提高效能。
演讲提纲:
1. 通用大模型在金融场景应用的挑战:
- 知识工程的成本问题
- 模型的成本问题(token + 延时)
- 模型评估挑战 - 数据难题
2. 数据与知识工程的探索与实践:
- 知识提取
- 数据合成
3. 大模型应用实践
- APO实践
- 模型后训练实践
- 模型推理与加速
听众收益:
1. 了解大模型在金融领域落地时的挑战;
2. 了解应对挑战的具体方法论与实操落地经验。
知识工程与Ontology:构建语义层,驱动大模型的数字孪生实践
随着人工智能与大模型技术的快速发展,知识工程在实现物理世界数字孪生的过程中面临着管理碎片化、语义歧义、数据逻辑割裂等核心挑战。本次演讲将围绕平安科技在数据中台与知识工程领域的实践,探讨如何通过本体论(Ontology)构建统一的语义层,增强大模型对复杂业务逻辑的理解与推理能力,从而支撑更精准、可解释的数字孪生应用。
并结合平安团队在数据技术管理、平台建设与集团级数据中台规划中的经验,分享从理论到落地的关键路径,为行业提供可借鉴的方法与思路。
演讲提纲:
1. 知识工程在数字孪生时代的挑战
2. 本体论(Ontology)的核心价值:从数据到语义的跨越
3. 平安科技实践:语义层与数据中台的融合路径
4. 赋能大模型:如何通过语义层提升准确性与可解释性
5. 未来展望:知识工程与AI融合的发展方向
听众收益点:
- 了解如何通过Ontology与语义层设计,解决企业知识管理中的碎片化问题,提升数据资产的协同效率。
- 学习语义层与数据中台融合的实践方法,掌握支持大模型应用的数据架构设计思路。
- 深入理解语义增强如何提升大模型在复杂场景中的推理准确性与可解释性。
- 获取金融科技等领域数字孪生应用的前沿案例,拓展技术落地的可能性。
- 从企业级实践中洞察知识工程与本体论在工业界的挑战与创新方向。
Agentic RAG赋能业务增长:从场景痛点到价值落地的建设实践
本次演讲将结合在大型保险混合云等复杂场景中的实战经验,深入分享如何利用Agentic RAG技术应对知识治理、召回排序与提示工程等核心挑战,实现从场景痛点到业务价值的高效落地,为企业的智能化增长提供可借鉴的实践路径。
演讲提纲:
- 知识前期处理及向量化
- 多类型文档处理
- Agentic RAG构建演讲过程设计
- 金融场景实践案例
听众收益:
- 大量文档,如何进行前期知识治理的入库
- 召回准确与排序精度
- 如何进行RAG提示词工程构建
- Bad Case分析及迭代
LLM + 知识图谱驱动的数仓智能化实践:从基建架构到交付流重构
面对万级任务、十万字段的超大规模数仓,如何突破“找表难、写 SQL 慢”的效能瓶颈?本分享介绍 B 站商业数仓如何构建智能化基建框架:以 Neo4j 知识图谱为底座,通过 MCP 协议赋予 AI 实时感知能力。在此基础上,重点拆解智能化交付实践(prd2sql):采用 Claude Code 交互模式,将原本碎片化的开发流程重构为“需求补全-血缘探查-代码生成-自动校验”的半自动闭环。该方案实现了 80% 的 SQL 生成准确率,并为后续自动化治理奠定了架构基础。
演讲提纲:
现状:万级拓扑下的元数据“黑盒”与交付瓶颈
基建:智能数仓神经系统——Neo4j 知识图谱建模与 MCP 协议设计
实践:需求交付流智能化重构——基于 Claude Code 的人机协作链路
复盘:复杂场景(如人群包、归因链路)下的 80% 准确率调优实录
愿景:场景无界——从交付场景向自动化治理与分析场景的横向扩展
听众收益:
1. 架构模型: 获取“知识图谱 + MCP + LLM”的解耦式智能数仓大框架设计。
2. 落地经验: 学习如何通过“交互式开发”而非“黑盒自动化”解决复杂需求的交付质量和效率。
3. 效能洞察: 掌握在超大规模环境下提升 AI 感知确定性的实战策略。
AI Agent落地实战:汇丰科技的智能化SDLC改造之路
AlAgents 和 MCP 正在引领软件开发生命周期(SDLC)的深刻变革。通过内部开源与协作共建,我们创建多个 Agent+MCP 方案无缝集成到主流开发工具如 VSCode,GitHub Copilot,Jira,Confluence等),提升团队效率,推动软件开发的创新实践与质量提升。
演讲提纲:
1. 金融科技开发的现实与挑战
- SDLC 中的核心痛点:效率,协作,质量与合规压力
2. Al Coding 与 Agent 平台建设实践
- 内部开源与社区共建的 Al Coding 实践分享平台
- 定制化 Copilot 插件与 MCPHub,实现与 VS Code,GitHub Copilot,Jira 等工具的深度集成
3. SDLC实践案例分享
- AlAgent 在需求分析,架构设计,编码,评审,测试,部署等环节的典型案例
4. 落地经验与关键要素
- 组织与团队的适配路径:从试点到规模化推广的实践方法
听众收益:
深入了解 AI Agent + MCP 在 SDLC 中的实际应用及易与价值;
掌握 AI Agent 和 MCP 如何优化软件开发生命周期的各个环节,从需求分析到测试部署,助力团队降本增效;
把握 AI 驱动软件开发的未来趋势,为团队引入智能化开发模式提供参考。
企查查字段血缘的大模型实践
面对企查查多源、海量企业数据带来的字段语义模糊、变更影响难评估等治理痛点,我们放弃了传统仅能解析表级血缘的工具,创新性地引入大模型技术。
我们的核心方案是设计精准的提示词工程,让大模型直接解析SQL脚本,同时完成字段级血缘链路发现与业务含义智能标注。落地中,我们重点攻克了大模型“幻觉”导致血缘不准的挑战,通过构建校验规则与人工复核闭环,将血缘准确率提升至95%以上。
该实践成效显著,目前已完成80%核心报表的字段血缘覆盖,使数据变更的影响分析耗时从“人天级”降至“分钟级”,极大保障了企查查亿级数据资产的可靠性与透明度。
演讲提纲:
一、背景:为何要在企查查做字段血缘
二、核心架构:大模型赋能字段血缘的“技术蓝图”
三、实践与挑战:落地过程中的“得”与“失”
四、总结与展望:价值回顾与未来演进
听众收益:
1、大模型在数据工程中的角色,可以从“副驾驶”升级为“自动驾驶员”。
2、字段级血缘的突破,能如何直接驱动业务敏捷性与数据可靠性。
高效AI创新的技术路径、组织实践与工具沉淀
本次演讲将从技术与管理融合的视角,深入剖析在成熟互联网公司内进行AI创新的系统性方法。我们将探讨:为何独立的组织架构对AI创新至关重要;从资源、数据到技术基建,成功的AI创新需要哪些核心条件;在POC阶段,我们在技术选型、业务对齐及团队协作上遇到的具体挑战、走过的弯路及迭代过程;并最终分享去哪儿网AI Lab经过实践验证的、可复用的高效研发与协作模式。
演讲提纲:
1. 去哪儿网AI Lab:技术驱动的内部创新引擎
- 不只是支持部门,更是“内部创业者”
- 核心成果简介(Qunar AI行程助手、端外比价助手等)背后的技术架构选型与关键决策点
2. 成熟企业AI创新的技术与管理双轨必要条件
- 业务理念创新:在旅游OTA企业中对AI应用场景进行合理化分类,识别真需求
- 技术基石:API应用与模型自部署、Bert与GPT混合应用、ReAct与P-E
- 组织保障:一把手工程建设,流程独立与基建独立,OPC概念的引入与落地
- 业务耦合度:垂类AI应用的局限性、垂类APP能否孕育非垂类AI产品?
3. POC 阶段的陷阱、技术债务与敏捷修正
- 弯路复盘:快就是慢,慢就是快,复用现有基建是需要评估的,借用非创新团队人员是需要极其慎重的,小打大优势将是常态
- 革新实践:从职能化分工到 OPC 的思维转变,建立快速试错闭环
- 工具化沉淀:如何让基建不拖后腿是个问题
4. 持续进化:去哪儿网 AI Lab 的高效实践框架
- 研发流水线:从分到合,从解偶优先到信息可见优先
- 团队协作模式:从分工到OPC
- 技术选型与工具栈:用贵的,然后讨论如何科学的节省
听众收益:
1. 理解在成熟企业体系内,从0到1构建AI产品所需的技术规划与组织设计。
2. 获得针对AI产品 POC 阶段常见技术与管理难题的具体解决方案。
3. 深入了解垂类 AItoC 产品在模型优化、用户体验及效果评估方面的独特挑战与见解。
4. 学习当前业界前沿的AI应用开发团队组织形态与高效协作实践。
多模态内容表征在音乐推荐场景的应用
随着大语言模型与多模态大模型的突破,AI正实现对音频、文本、图像、用户行为等多源信息的深度融合。在云音乐场景中,多模态模型可协同解析旋律、歌词、评论、封面及用户行为,构建更精准的内容表征与意图识别体系。
本次分享以推荐系统落地为例,探讨多模态融合如何提升推荐效果与体验,并剖析其在内容理解、生态构建与个性化服务中的核心价值,为技术实践提供参考。
演讲提纲:
1. 云音乐推荐的演进与挑战
2. 多模态内容理解模型
3. 多模态内容理解在歌单场景、长音频场景的应用
听众收益:
1. 了解云音乐推荐系统的演进发展
2. 了解多模态内容理解模型的落地方法
3. 了解内容理解赋能推荐的多种创新方式
从流量连接到任务托管:1688B2B生意在Agentic范式下的技术演进迭代
电商的终点不只是让用户看到商品,而是帮用户买到对的东西。Agentic系统的核心是让机器像专业的采购专家一样,能自主思考并拆解任务。本次分享将深度拆解如何通过构建Agentic系统,搞定1688 平台上那些复杂、零散且极具个性化的采购难题,真正实现从搜商品到办成事的跨越。
演讲提纲:
一、B2B采购的本质挑战与AI搜索的使命
二、Agentic范式:从被动检索到主动任务托管的转变
三、1688 Agentic搜索系统的技术架构演进
1. 感知层升级:多模态与深度意图理解
2. 认知层突破:任务拆解与决策推理
3. 执行层创新:多Agent协作与工具调用
四、核心AI技术栈深度解析
1. NLP技术的演进应用
2. 多模态搜索的B2B实践
3. 强化学习在采购决策中的应用
4. 知识图谱与供应链推理
五、实战案例:Agentic系统如何解决典型采购难题
听众收益点:
1. 洞察下一代AI搜索的技术内核与演进方向。
2. 获得一套解决复杂、非标搜索难题的系统性方法论。
3. 明确AI搜索驱动业务增长与用户体验变革的价值锚点。
智能体革命:数据平台如何重塑保险业未来
在生成式AI推动下,数据平台成为智能体的核心装备库与动力引擎,重塑保险业未来。新范式数据平台包含四大核心层:智能体工厂层封装数据能力,降低开发门槛;智慧知识层专注非结构化数据,实现知识自动化与优化;决策仿真层融合数据提供预测服务;多模态感知层专注图像语义理解。业务场景中,团体销售助手解决数据孤岛,车商出单助手实现自动化出单,理赔数字员工完成协同决策。未来,数据平台将从管理数据迈向提供能力,更一体化、实时化与生态化,赋能智能体专注业务创新。
演讲提纲:
一、开场引入
1- 时代变革:生成式AI推动AI从“副驾驶”进阶为自主完成任务的“智能体”。
2- 传统局限:数据平台存在孤岛、迟缓、肤浅问题。
3- 新范式:数据平台成为智能体的“核心装备库”和“动力引擎”。
二、新范式数据平台的四大核心层
1- 智能体工厂层:封装数据能力为即插即用模块,提供可视化工作流,降低开发门槛。
2- 智慧知识层:专注非结构化数据处理,实现知识自动化生产、高效检索与质量优化。
3- 决策仿真层:融合内外部数据,提供预测服务,支撑智能体基于未来趋势决策。
4- 多模态感知层:专注图像语义理解与结构化数据提取,提供端到端视觉服务。
三、业务场景价值验证
1- 团体销售助手:通过知识层与工厂层,实现产品话术统一与快速部署,解决数据孤岛问题。
2- 车商出单助手:融合多模态识别、知识理解与工作流编排,实现自动化出单。
3- 理赔数字员工:结合图像识别、风险预测与规则管理,完成跨领域协同决策。
四、总结与展望
- 数据平台从“管理数据”迈向“提供能力”,通过四大层次将数据转化为即服务(Data as a Service),赋能智能体专注业务创新。未来平台将更一体化、实时化与生态化。
听众收益点:
- 听众将会了解如何借助新一代数据平台打破数据孤岛、提升决策实时性与深度,实现保险业务自动化与智能化,显著降低开发门槛、优化知识管理效率,并在销售、出单、理赔等场景中快速落地智能应用,最终赋能业务创新与增长。
DataAgent在同程分析和营销场景的智能化建设探索
随着大模型和AI Agent能力不断提升,AI agent能力在企业业务分析中应用需求越来越高。通过AI的数据智能分析与营销智能化,跟业务分析和运营工作方式和效率带来了深刻的变革。然而Agent在一些细节上,任然面对诸多挑战,如业务领域知识不足、模型幻觉产生,如何保证准确找回,数据安全,以及多Agent间如何协同等,这些问题都直接影响用户使用体验和系统落地效果。
本次演讲,我主要将分享同程旅行在DataAgent建设实践,包括分析任务拆解规划、知识、记忆、归因分析,以及结合分析结论的智能营销建议和智能营销流程建设优化等能力的关键技术和实现细节。
演讲提纲:
1、多智能体的架构演进
2、DataAgent架构设计
3、智能分析:洞察归因分析和数据分析的深度研究
4、智能营销:根据分析建议智能化营销流程闭环探索
听众收益:
1、数据分析Agent的技术实践,如何设计自主规划,任务拆分完成智能化分析引擎建设
2、根据分析建议,打通营销流程,建设智能化营销替换
3、多Agent间如何协同工作
从对话到任务:用多智能体重构「上下文工程」
工程实践中越来越核心的问题是,当任务从单轮对话扩展到长程、多步骤、多工具协作时,我们如何管理越来越复杂的“上下文”?
传统的上下文工程,可能还停留在如何让一个模型记住更长的对话。但在真实的企业场景中——无论是销售数据更新、市场调研,还是游戏生产——任务往往是异步的、并行的、容错需求极高的。这就需要我们把上下文从“一段文本”,升级为可编程、可追踪、可恢复的任务记忆与状态系统。
在这次分享中会介绍如何在 CAMEL 框架中,通过“角色扮演”机制和架构设计,让多个智能体自主管理任务上下文、分工协作的。并详细展示新一代系统 Eigent——它不仅仅是一个多智能体框架,更是一个具备组织行为的AI 劳动力系统,能像人类团队一样处理长达数周、需要动态调整的复杂任务。
加以实际案例说明,这种范式如何从根本上改变我们构建大模型应用的方式——从精心设计单一提示词,到设计智能体的组织规则与协作流程。
演讲提纲:
一、重新思考上下文:从对话记忆到任务进程
- 从我们过去的项目经验说起:当任务步骤超过10步、工具调用超过3个,传统“长上下文”设计的瓶颈在哪?
- 为什么多智能体协作本质上是“上下文的分布式管理与演进”?
二、CAMEL 的设计哲学:用角色扮演解耦复杂任务上下文
- 如何通过定义“角色”与“社会规范”,让智能体自主维护与交换任务上下文?
- 底层架构如何支持这种上下文的持久化、共享与版本控制?
三、聚焦 Eigent:长程任务上下文的管理实践
- 上下文即状态:我们如何实现任务的异步执行与断点续传?
- 上下文的鲁棒性:任务链中途失败,如何自动诊断、修复上下文,而非重头再来?
- 上下文的动态扩展:系统如何根据任务进展,实时组建新智能体、加载新工具,动态扩展上下文边界?
四、未来展望:智能体的“组织上下文”与缩放定律
- 当智能体数量增长,组织内的上下文交换如何引发智能涌现?
- 我们对“智能体缩放定律”的早期观察:环境复杂度、智能体数量与任务成功率的关系。
- 下一代上下文工程:从管理文本,到管理智能体组织的记忆、决策与协作流程。
听众收益点:
1. 理解“上下文工程”如何从单一模型的文本管理,演进为多智能体系统的任务状态与组织记忆管理。
2. 通过企业自动化案例,获得在多步骤、多工具、高容错场景下的系统设计思路与避坑经验。
3. 了解智能体协作中的缩放定律与研究前沿,为自身技术布局与产品规划提供参考。
金融大模型:架构变革、工程实践与Agent智能体的前沿探索
恒生电子研究院AI首席技术专家,AI产品部部长,高工,浙江省人工智能学院博导,浙江师范大学、浙江理工大学兼职教授。主要研究领域包括自然语言处理、大模型、OCR等,并拥有超过20多项AI专利和论文,赋能投顾、客服、运营、风控、投行等场景。
超越通用大模型:金融领域的高效适配与数据价值挖掘
资深算法专家,上海市高级工程师,国际注册特许工程师;专注大模型算法研究与应用,在金融科技、通信、医疗等业务场景成功落地多个商业项目;接受环球时报、人民日报、中国商务新闻网等知名媒体采访,发表多篇科技署名文章、政策解读及学术论文,国内与国际发明授权专利 10 多项。
知识工程与Ontology:构建语义层,驱动大模型的数字孪生实践
电子科技大学硕士毕业,曾服务于中通服,TeraData 等知名公司。现就职于平安科技数据管理部门,任技术平台组负责人(高级经理),曾负责引领集团数据中台的规划、建设,现负责集团数据技术管理运营工作以及集团数据管理相关平台的建设。
Agentic RAG赋能业务增长:从场景痛点到价值落地的建设实践
太平洋保险集团云首席专家兼AI中台负责人,具备十多年的系统开发维护,云产品架构设计、解决方案设计经验,多年金融单位、互联网云厂商工作经验,做为总架主导过多家大型银行私有云/金融云、某保险集团混合云/专有云建设、城商行云化转型等项目建设;目前主要负责集团云计算云原生、AI中台能力建设、业务双活/单元化体系建设,资源混部、智能运维、混沌工程等课题。
LLM + 知识图谱驱动的数仓智能化实践:从基建架构到交付流重构
主导构建了B站商业数仓“智能化底座”,通过Neo4j知识图谱与 MCP 标准化感知协议,打通了 LLM 与万级数仓资产的通信闭环。目前专注于需求交付工作流(prd2sql)的智能化重构,在万级任务规模下实现了高准确率的人机协同开发实践。
AI Agent落地实战:汇丰科技的智能化SDLC改造之路
具有15年金融科技从业经验,工作范围包含软件开发、测试、运维、架构师、项目经理、交付经理、产品经理等;服务过汇丰科技、广汽汽车金融、小鹏融资租赁、恒生银行等企业。
企查查字段血缘的大模型实践
深耕大数据领域十年,拥有丰富的数据平台建设与治理经验。对数据架构、血缘治理有深刻理解,是资深的数据技术实践者与分享者。
让 Agent 学会自主迁移 GPU 推理系统:从 CUDA 到 MUSA 的工程化实践
主要从事 AI 推理系统与基础设施(AI Inference / Infra) 方向的研发工作,关注大语言模型在异构硬件与大规模集群环境下的高效部署、性能优化与工程落地。
目前的研究与实践重点包括:LLM 推理引擎设计、算子与调度优化、GPU/加速器适配、分布式推理架构,以及推理系统在 Kubernetes 等云原生环境中的集成。
同时也是 llama.cpp 与 sglang 的社区协作者,长期参与推理框架在多硬件平台上的扩展与工程化改进,致力于降低 LLM 推理系统的使用门槛,并提升其在真实工业场景中的可维护性与可扩展性。
高效AI创新的技术路径、组织实践与工具沉淀
在互联网行业深耕16年,曾在DDD领域驱动设计,公司级系统稳定性建设以及企业技术文化建设方面有较多的研究、落地实践与文字输出。25年以来创建去哪儿网 QUNAR AI Lab,聚焦于 AI toC端应用实践,尤其是旅游OTA垂类的AI to C端应用实践。
多模态内容表征在音乐推荐场景的应用
网易云音乐推荐算法专家,有多年一线推荐算法和大模型应用开发经历,对大模型结合推荐系统有深入了解和实际落地经验。
从流量连接到任务托管:1688B2B生意在Agentic范式下的技术演进迭代
张进目前是阿里集团1688 买家 Agentic AI团队负责人。具有多年NLP,多模态,强化学习等AI相关领域的研究工作,多年AI创业经历,当前负责1688的AI原生应用以及AI创新产品的研发。
智能体革命:数据平台如何重塑保险业未来
平安财产险数据服务平台组负责人,负责数据产品平台、搜索推荐、客户策略平台、共同资源AI团队。在大模型Agent平台建设以及数据平台赋能智能体有丰富经验。
DataAgent在同程分析和营销场景的智能化建设探索
长期深耕大数据领域,擅长大数据应用平台建设和AI for Data 和 Data for AI 数据平台体系建设和落地,目前专注Data+AI,帮助业务提升数据赋能效率,驱动业务决策。
光大银行基于大模型的数据开发一体化创新实践
中国人民大学计算机应用技术硕士,开源社区Committer,主导光大银行数据领域第一个全行员自研项目并取得良好效果,后历任多个项目技术经理、项目经理,现担任团队主管。
从对话到任务:用多智能体重构「上下文工程」
范文栋 CAMEL-AI.org核心工程师,都柏林大学统计学硕士。自2024年4月加入团队并主导开源CAMEL多智能体框架的开发和优化。在任期间,CAMEL和OWL两个开源项目Github破万。
擅长数据建模、机器学习、自然语言处理(NLP)和生成式AI。曾任巴斯夫AI工程师,为销售,供应链,生产等多个业务领域构建AI解决方案,曾主导团队的第一个生成式AI项目并取得专利。曾在爱尔兰中央统计局开发NLP驱动的职业分类系统,实现人口普查数据处理自动化;曾参与平安科技知识图谱项目,构建企业级产业链数据库。具备从AI模型研发到应用部署的完整技术能力。