使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2 天沉浸式学习交流 | 15+前沿分论坛 | 60+真实应用案例
科技日新月异,大数据与人工智能等技术的迅猛发展正引领各行各业迈向变革的新纪元。数据量的激增与计算能力的跃升,成就了大模型技术的崛起,为人工智能的飞跃式发展注入了新的动能,数据与智能双向深度融合彰显出无限潜力。
经历了初期的狂热,业界对大模型的看法已逐渐回归理性。技术终究是工具,其价值在于落地应用与创造实际效益。大模型的进一步发展对数据科学理论与数据工程技术提出了日益迫切的需求;数据在大模型产业发展中扮演着日益重要的角色。大模型与大数据如何双向奔赴、如何深度融合、如何赋能产业,成为了当前大数据与人工智能研发的关键议题。
基于此,本次“数据融百业,智能创未来”线下大会汇聚业界顶尖专家学者与行业领袖,共同研讨大数据、大模型等技术的最新动态与应用实践。我们期待通过这一平台,激发知识交流与思想碰撞,发掘创新与合作契机,共同探索数据智能推动行业数字化转型升级与高质量发展的路径。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
在大数据、人工智能领域拥有超过20年研发经验。目前负责阿里云大数据和机器学习平台,支撑达摩院、淘宝、菜鸟等大数据存储、计算、分析和机器学习的需求,同时服务于数以万计的云上客户。
曾担任NewsBreak工程总负责人,负责AI系统、推荐、广告等业务,并成功推动NewsBreak技术及商业化转型。
曾担任微软搜索与人工智能事业部工程副总裁和全球杰出工程师,带领团队研发搜索、对象存储、大数据计算、深度学习平台和框架,支撑微软Bing、Office365、Azure、大语言模型研究等业务。创建和领导了大规模深度学习团队DeepSpeed,并发布了当时最大的语言模型170亿参数的Turing-NLG。
纽约大学计算机硕士学位、中国科学技术大学计算机和经济管理双学位。
阿里云EMR研发团队负责人,资深技术专家,Apache Flink & HBase PMC Member,Apache软件基金会Member。
数据库和大数据技术爱好者,负责聚好看云平台、数据库、大数据、业务中台、运维与测试,海信集团数智化转型核心成员。
芝麻企业信用技术负责人,负责整体技术工作。之前就职于网商银行,Uber美国以及PayPal,在综合金融系统,Uber增长平台,基础架构有多年经验。获得加州大学默塞德分校硕士,从事计算机视觉相关研究。
个人介绍:周卫林,Aloudata(大应科技)创始人 & CEO,曾任蚂蚁集团研究员(P10)、蚂蚁集团数据平台部总经理,拥有 20 余年大数据领域从业经验,是国内最早一批数据仓库先行者。他曾深度参与并主导了阿里/蚂蚁集团从传统数仓体系到数据智能体系的数据技术演进过程,全面支撑了蚂蚁集团从支付工具到数字生活平台的升级,横向推动了整个蚂蚁集团业务数据化、智能化水平的提升。除此之外,他还是多个有影响力的数据工具类产品的主要缔造者,并由此孵化出多个进入 Gartner、Forrester 领导者象限的阿里云拳头产品。
云器科技联合创始人兼 CTO,曾任阿里巴巴 P10 研究员,主导了阿里云飞天大数据平台二代研发及落地,曾于微软云计算和企业事业部工作近十年,浙江省科技进步一等奖获得者。
个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到3100余次,H-index达到29。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,自然语言处理专委会秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
众安保险数据产品与数据基建团队负责人,兼任众安金融数据中心负责人。拥有多年数据领域产品研发管理经验,深耕金融行业,专注于AI工程化、流批一体架构与金融业务场景的深度融合。在DataOps体系搭建、智能决策引擎开发等领域具备丰富实战经验。
中国平安人寿保险股份有限公司架构与数据管理团队总经理,大数据标准技术推进委员会首批数据中台专家、香蜜湖金融科技创新特征与趋势报告(2021)编写组成员;毕业于四川大学,2001 年加入平安,拥有 20 余年保险信息化系统建设和数据管理经验,参与并部分主导公司数字化转型战略,主导寿险数据技术迭代升级,从传统数仓向数据集市、大数据平台、数据中台持续演进,带领团队历获金保奖”卓越保险科技数据中台奖(2023)、“金信通“金融科技创新应用案例特色奖(2022)、香蜜湖金融科技创新奖优秀项目奖(2019)、深圳市金融创新奖一等奖(2016)、二等奖(2023)等。
喜马拉雅智能引擎与分发部负责人,负责搜索、推荐与AI产品创新。关注搜推、大模型应用与生成式推荐等方向,曾就职于美团、阿里等公司。
深耕软件与数据领域二十年,聚焦大数据治理与智能计算,推动数据资产化、智能化,实现数据价值的可持续释放。
中兴通讯数字化专家,长期深耕企业数智化转型与AI应用落地领域。致力于打造可复制、可推广的企业AI实践范式。
20余年通信运营商/物联网/互联网平台建设经验;牵头多个国家省部级项目设计落地;目前专注于公司集团化/智能化能力建设工作。
企业级本体工程:从Palantir方法论到实践 | Data+AI一体化架构,赋能BI/AI | Agentic RAG:从检索增强到自主决策 |
|
|
|
| 非结构化数据工程:文档/图像/视频的AI化处理 | 数智新金融 | AI for Data:数据治理智能化升级 |
|
|
|
| Agent Ready数据架构:下一代数据基础设施 | AI驱动的数据开发与分析一体化 | Agentic AI开发框架与工具链 |
|
|
|
大模型应用成本优化实战 | LLM+研发效能:从代码生成到智能研发 | AI搜索:从关键词到智能对话 |
|
|
|
| Agent应用安全与可控性 | 数智新消费 | 上下文工程——大模型应用落地的核心工程实践 |
|
|
|
负责数据开发和管理平台Dataverse、实时计算平台、AB实验平台、RedBI分析平台和UBA 用户行为分析平台的技术研发工作,《极客时间》数据中台实战课作者,订阅量超过 3W+,拥有13年互联网数据开发和管理的实践经验,最近一年专注于Data+AI 数据平台的构建实践。
太平洋保险集团云首席专家兼AI中台负责人,具备十多年的系统开发维护,云产品架构设计、解决方案设计经验,多年金融单位、互联网云厂商工作经验,做为总架主导过多家大型银行私有云/金融云、某保险集团混合云/专有云建设、城商行云化转型等项目建设;目前主要负责集团云计算云原生、AI中台能力建设、业务双活/单元化体系建设,资源混部、智能运维、混沌工程等课题。
在互联网行业深耕16年,曾在DDD领域驱动设计,公司级系统稳定性建设以及企业技术文化建设方面有较多的研究、落地实践与文字输出。25年以来创建去哪儿网 QUNAR AI Lab,聚焦于 AI toC端应用实践,尤其是旅游OTA垂类的AI to C端应用实践。
负责哈啰的搜推广/NLP/CV相关算法。曾就职于网易和阿里巴巴。十多年搜推广算法老兵。主导过搜推广(自动化营销、互动式广告引擎、视频与内容推荐)多个创业业务算法体系、基础算法(端智能 、智能客服、视觉核查平台) 等 0-100阶段多个不同方向。目前关注大模型和AIGC在哈啰内外应用。
连续2届担任腾讯前端技术委员会委员,现担任腾讯低代码开源协同 Oteam PMC,腾讯云架构师上海理事会理事。目前带领团队在全链路AI Coding领域进行实践落地,有丰富的AIGC特别是AI Coding,AI+低代码开发领域的提效落地实践经验。此外,在低代码相关领域实践多年,曾参与信通院低代码无代码标准制定、主导IEEE,大湾区,公司内低代码相关标准编制,在阿里 D2 、GIAC、QCon、ArchSummit、QEcon等大会上进行多次出品和演讲工作。
十六年互联网行业技术架构、云技术体系建设老兵,早期在互联网甲方经历了从刀耕火种到业务井喷下的自动化技术建设及落地;先后就职UCloud、阿里云,经历了云技术快速发展的关键时刻,有丰富的云上技术经验,长期专注行业技术架构、技术保障及新技术应用,聚焦零售、游戏、教育、企业、大模型、具身智能、智能驾驶等行业客户,重心大模型各垂类智能体工程化实现、后训练加速、AI Infra等全栈AI实践;追求以“技术洞见未来”,有幸成为千行百业AI技术变革的一员。先后分享著作有《重保护航——保障云上巅峰时刻》、《游戏行业技术服务与实践》、《云上社交行业白皮书》、《云上奥运技术实践体系》、《AI卓越架构与技术服务白皮书》等。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
吕航飞现在负责某一线互联网公司现有系统智能化架构演进。历任百度商用CRM SAAS系统及座舱语音智能体架构师,SAP某业务团队SaaS技术负责人。擅长复杂系统落地及重构,AI Agent落地。
长期负责公司的技术战略与数字化运营创新,在数字化运营方面,通过建立三套“KY”体系(KYC、KYP、KYI)来精准匹配用户与金融产品,并推动服务模式从“以产品为中心”转向“以用户为中心”。在技术应用上,朱益盛主导了多项创新实践,如开发智能“巡检机器人”前置发现APP使用问题,以及利用AI、大数据和知识图谱技术实现用户需求预测和风险预警。同时,他注重数据安全与隐私保护,强调所有数字化探索均在合规前提下进行。
企查查字段血缘的大模型实践
面对企查查多源、海量企业数据带来的字段语义模糊、变更影响难评估等治理痛点,我们放弃了传统仅能解析表级血缘的工具,创新性地引入大模型技术。
我们的核心方案是设计精准的提示词工程,让大模型直接解析SQL脚本,同时完成字段级血缘链路发现与业务含义智能标注。落地中,我们重点攻克了大模型“幻觉”导致血缘不准的挑战,通过构建校验规则与人工复核闭环,将血缘准确率提升至95%以上。
该实践成效显著,目前已完成80%核心报表的字段血缘覆盖,使数据变更的影响分析耗时从“人天级”降至“分钟级”,极大保障了企查查亿级数据资产的可靠性与透明度。
演讲提纲:
一、背景:为何要在企查查做字段血缘
二、核心架构:大模型赋能字段血缘的“技术蓝图”
三、实践与挑战:落地过程中的“得”与“失”
四、总结与展望:价值回顾与未来演进
听众收益:
1、大模型在数据工程中的角色,可以从“副驾驶”升级为“自动驾驶员”。
2、字段级血缘的突破,能如何直接驱动业务敏捷性与数据可靠性。
企查查字段血缘的大模型实践
深耕大数据领域十年,拥有丰富的数据平台建设与治理经验。对数据架构、血缘治理有深刻理解,是资深的数据技术实践者与分享者。