微信分享
DA数智大会2025 · 深圳站

使用微信扫一扫分享到朋友圈

活动分享
DA数智大会2025 · 深圳站

使用微信扫一扫进入小程序分享活动

专题演讲嘉宾
  • 阿里云 智能计算平台事业部 MaxCompute负责人张治国
    张治国
    阿里云 智能计算平台事业部 MaxCompute负责人
  • Grab Head of Data Science, Integrity and Core Experience陈嘉 博士
    陈嘉 博士
    Grab Head of Data Science, Integrity and Core Experience

    现任职东南亚领先的平台公司Grab,领导风控、安全、用户体验、智能客服等业务的机器学习算法团队,负责构建人工智能模型和解决方案,并致⼒于推动公司的⼈⼯智能战略落地。


    陈嘉在人工智能领域拥有超过15年的研发与管理经验,曾在联想担任机器智能实验室主任,并作为早期成员加入华为诺亚方舟实验室。此外,他还曾参与创立两家AI创业公司。陈嘉持有计算机科学博士学位,拥有超过10项专利,并在顶级会议期刊发表15篇学术论文,多次推动与高校与政府项目合作。

  • 阿里云 搜索技术专家刘松
    刘松
    阿里云 搜索技术专家
  • Gbox AI CTO王振威
    王振威
    Gbox AI CTO

    多年 Cloud Infra,DevOps,AI Agent 领域经验。前氦三科技 CEO,曾任职 Coding.net / 腾讯云高级研发总监。

  • 阿里云 高级产品专家赵弘扬
    赵弘扬
    阿里云 高级产品专家
  • 腾讯 微信事业群技术架构部高级工程师吴乾豪
    吴乾豪
    腾讯 微信事业群技术架构部高级工程师

    硕士毕业于华南理工大学,在 DevOps、大数据、AI云原生领域有超过9年的工作经验,对 Kubernetes 及其开源组件改造、架构调优、周边生态建设等有丰富的经验。目前就职于微信技术架构部,负责大数据、AI on Kubernetes 的相关基础建设,从0-1支持了微信相关业务云原生大规模落地,实现了全面上云。

  • 作业帮 大数据研发工程师刘泽强
    刘泽强
    作业帮 大数据研发工程师

    在作业帮主要负责实时计算平台的研发、Flink引擎的开发维护,以及 StarRocks OLAP引擎。

  • 小米 软件研发工程师肖杰宝
    肖杰宝
    小米 软件研发工程师

    肖杰宝,小米公司软件研发工程师,Apache Gravitino Committer。目前主要负责数据湖 Iceberg 和元数据湖 Gravitino 等相关研发工作。

  • 趣丸科技 媒体算法负责人马金龙
    马金龙
    趣丸科技 媒体算法负责人

    研究生毕业,10+年算法研发经验,CCF专业会员,参与语音识别评测T/ISC 0034-2023标准制定,负责过音频前后端处理,弱网优化,音视频质量提升,智能内容安全审核“T网”,内容理解“T悟”等大型项目,目前主要负责AIGC类算法研发,包括自研LLM领域大模型,语音大模型,图像生成等。曾作为“灵声讯”创始人,参与智能媒体技术自媒体运营和推广。


  • 杭州群核科技(酷家乐)资深技术总监胡广寰 博士
    胡广寰 博士
    杭州群核科技(酷家乐)资深技术总监

    毕业于浙江大学计算机系,获得博士学位。拥有20余年互联网和软件行业经验,先后就职于了Ask.com、淘宝、菜鸟、酷家乐,在搜索引擎技术、大数据工程技术、Web应用开发、研发效能提升、云原生架构和基础设施建设、AI应用开发、信息和数据安全等技术方向有深入研究和实践。

  • 滴滴 资深大数据研发工程师林雨
    林雨
    滴滴 资深大数据研发工程师

    多年互联网从业经验,从事大数据 OLAP 方向研发5年以上,熟悉 Druid/Presto/ClickHouse/StarRocks 等大数据引擎,为 ClickHouse 社区和StarRocks 社区提交多个 PR,目前致力于将滴滴大数据 OLAP 引擎统一到 StarRocks 而努力。

  • IDEA研究院基础软件中心 AI辅助编程专家祝海林
    祝海林
    IDEA研究院基础软件中心 AI辅助编程专家

    Auto-Coder/Byzer-SQL 作者,前 Kyligence 技术合伙人,IDEA 研究院,目前致力于使用AI赋能数据领域和编程,研发MoonBit语言的Code Agent: moonagent. Byzer-SQL 获得22年中国开源创新大赛二等奖,23年浦东新区人工智能创新大赛一等奖,Auto-coder 获 Gitcode 24年度十大开源项目,个人获得 Gitcode 24年度开源人物,个人入选中国22年开源先锋33人,荣获23年全球人工智能开发者先锋大赛"开发者先锋"称号。


  • Elastic 首席布道师刘晓国
    刘晓国
    Elastic 首席布道师

    中国社区首席布道师。新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过电脑设计,汽车电子,计算机操作系统,通信,云实时事件处理等。从爱立信开始,诺基亚,Ubuntu 到现在的 Elastic,从事社区工作有将近 20 年的经历。喜欢分享自己所学到的知识。坚信帮助别人就是帮助自己。希望和大家一起分享及学习。欢迎大家来参阅 Elastic 官方中文博客 elasticstack.blog.csdn.net

  • Pinterest Sr. Staff Software Engineer罗震霄 博士
    罗震霄 博士
    Pinterest Sr. Staff Software Engineer

    罗震霄在Pinterest担任Sr. Staff Software Engineer,负责大数据实时处理引擎,监控平台,和大模型数据预处理。在加入Pinterest之前,罗震霄先后在 Cloudera,Uber,Twitter,Facebook 负责大数据引擎和机器学习平台的研发和运营工作。罗震霄是开源项目 Presto committer,Presto Technical Steering Committee member。本科毕业于复旦大学,博士(on leave)毕业于 University of Wisconsin Madison。

  • 百度 工程效能部前端研发经理杨经纬
    杨经纬
    百度 工程效能部前端研发经理

    百度工程效能部前端研发经理,负责文心快码Comate、DevOps工具平台、Comate Stack AI原生研发工具链等业务前端研发团队,在软件研发智能化、DevOps、研发提效、前端研发技术、技术团队管理等领域有着丰富的经验,并在相关领域著有发明专利8个,国家高质量专项《基于大模型技术的工业领域智能化开发工具项目》技术骨干。

  • 平安人寿 数据挖掘专家陈依云
    陈依云
    平安人寿 数据挖掘专家

    从事数据挖掘相关工作10年,负责公司寿险领域核保风控模型、理赔自动化等模型开发,参与基于大模型的chatBI项目研发。参与的风控模型项目曾获得“燕梳奖”、“金信通”奖等荣誉。

  • 字节跳动 算法专家蔡聪怀
    蔡聪怀
    字节跳动 算法专家

    哈尔滨工业大学硕士毕业,先后就职于腾讯、字节跳动。从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。

  • 蚂蚁集团企业信用部算法负责人马宇翔
    马宇翔
    蚂蚁集团企业信用部算法负责人
  • 货拉拉 大数据存储资深工程师闫蒙蒙
    闫蒙蒙
    货拉拉 大数据存储资深工程师

    拥有多年大数据存储研发经验,主要负责货拉拉 HBase、大数据离线存储、向量存储的研发和维护,同时是开源 Apache HBase contributor。

  • Grab 数据基础设施平台负责人成峰
    成峰
    Grab 数据基础设施平台负责人

    专注于大数据基础设施和平台开发,拥有多年在数据工程和技术管理领域的经验。在 Grab 工作期间,我负责开发旨在简化数据湖使用的工具,并推动公司 Data Mesh 的落地。 这种架构强调自助服务平台设计,专注于数据访问的民主化,并通过自动化智能决策实现大规模的业务洞察。


    有幸带领团队完成了一些关键项目,为 Grab 的数据平台构建关键基础设施,包括 Kafka 基础设施、MIDAS(指标平台)、自动化数据迁移和集成平台、元数据湖治理套件以及各种计算引擎(Spark,Trino,StarRocks,Pinot)、 数据智能BI工具等。

  • 三维家 首席产品官曹健
    曹健
    三维家 首席产品官

    三维家首席产品官&合伙人,从事家居设计软件12年,所负责产品为3D设计软件,VRAR全景,数字孪生等技术。SaaS软件订阅超过100w用户,创造超过10亿营收规模SaaS产品。


  • 云启星辰 联合创始人&CTO刘永峰
    刘永峰
    云启星辰 联合创始人&CTO

    曾就职于腾讯,2017年作为联合创始人创立云启星辰,专注于AI技术在产业的深度应用与落地,拥有丰富的行业和技术的双重经验。

  • 腾讯大数据 算法研发工程师侯忱
    侯忱
    腾讯大数据 算法研发工程师

    侯忱,腾讯大数据算法研发工程师,2020-2023年在腾讯大数据开展隐私计算研发工作,曾获2020年iDash冠军。2023年至今,作为核心成员参与腾讯大数据的智能数据分析与交互式数据开发能力建设,搭建数据领域Agent开发服务平台。DataLab 论文(ICDE 2025 Industry Track)作者之一。


  • 腾讯微信 后台开发工程师熊涛
    熊涛
    腾讯微信 后台开发工程师

    2017年硕士毕业于浙江大学计算机专业。2018年至今,就职于微信实验平台,负责实验配置后台,指标计算系统,统计方法的相关研发工作。熟悉C/C++后台系统开发,大数据应用开发(Spark, Clickhouse),统计学基本原理。申请发明专利十余项,发表VLDB一作论文一篇。


  • 矩阵起源 AI平台研发负责人刘超
    刘超
    矩阵起源 AI平台研发负责人
  • 中国科学技术大学 认知智能全国重点实验室 博士尹铭佳
    尹铭佳
    中国科学技术大学 认知智能全国重点实验室 博士

    尹铭佳来自中国科学技术大学,是认知智能国家重点实验室和安徽省大数据分析与应用重点实验室的博士。主要研究兴趣聚焦于个性化推荐系统、用户复杂行为建模,和以数据为中心的人工智能等重点领域,曾在TOIS、KDD、ICML等国际高水平学术期刊会议上发表高质量论文多篇,并获得了数据挖掘领域顶级会议KDD2024唯一最佳学生论文奖。

  • 阿里国际 AI Business多模态数据负责人赵健杉
    赵健杉
    阿里国际 AI Business多模态数据负责人

    阿里国际AI Business多模态数据负责人,负责多模态大模型数据研发、数据标注、数据合成以及评估等工作。

  • vivo 互联网 大数据专家易龙
    易龙
    vivo 互联网 大数据专家

    现任vivo互联网大数据专家,拥有10年实践经验,专注于多模态数据技术相关的研发工作,对于海量数据场景下关于数据全链路稳定性保障、数据质量提升、数据成本优化等整体方案设计和落地有丰富经验,擅长从业务价值视角出发,提供有效的数智化解决方案。

  • 香港城市大学 博士李晓鹏
    李晓鹏
    香港城市大学 博士
  • Grab Head of Engineering王冠峰 博士
    王冠峰 博士
    Grab Head of Engineering

    王冠峰博士毕业于新加坡国立大学,曾在 FujiXerox Research Lab 担任研究员,现任 Grab R&D 的履约中台部门技术总监。在国际顶级会议上发表论文40余篇。

  • 平安人寿科技研发部 AI产品负责人莫洋
    莫洋
    平安人寿科技研发部 AI产品负责人

    现任平安人寿科技研发部AI产品负责人,曾任平安人寿渠道创新应用团队负责人、平安人寿董事会办公室数字化改革专家,前百度机器学习专家。推动AI赋能寿险业务体系化落地。


    带领团队获得国际/国家/省级重磅奖项18个;学术竞赛世界冠军10 个;国际顶会论文16篇;12项国际国家专利;国际学术会议审稿人。

  • 蚂蚁密算科技 基础设施技术专家徐基明 博士
    徐基明 博士
    蚂蚁密算科技 基础设施技术专家

    蚂蚁密算科技密码算法专家,北京大学博士后,在ASPLOS、MICRO等会议发表多篇论文成果,所设计密码方案在金融密码杯创新赛两次获奖,首个隐私计算一体机国际标准的主要贡献人之一,目前负责密态大模型场景下的密码安全设计。

  • vivo 人工智能部算法工程师梁天安
    梁天安
    vivo 人工智能部算法工程师

    硕士毕业于华中科技大学,从事推荐算法工作多年,目前负责vivo蓝心小V推荐场景算法优化。

  • 美的集团 首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow刘向阳 院士
    刘向阳 院士
    美的集团 首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow

    美的集团首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow IET Fellow ACM Distinguished Scientist。

  • 汇丰科技 人工智能研发专家韩方巍
    韩方巍
    汇丰科技 人工智能研发专家

    现任汇丰实验室人工智能研发工程师,拥有多年人工智能与机器学习领域的一线研发经验。目前专注于大语言模型在银行业务中的应用实践,聚焦模型能力评估、提示词工程及自动化优化流程的系统建设,推动大模型技术在金融行业的安全、可控、高效落地。

  • OPPO 数据平台部大数据架构师付庆午
    付庆午
    OPPO 数据平台部大数据架构师

    目前在OPPO数据架构组负责架构演进研发;Spark 开源RSS项目Shuttle发起人;Curvine高性能分布式缓存开源项目发起人;曾供职去哪儿网大数据,阿里云MC团队。

  • 腾讯 机器学习平台部 高级研发工程师占绍雄
    占绍雄
    腾讯 机器学习平台部 高级研发工程师

    腾讯机器学习平台部-计算中心高级工程师,主要负责 BiFang 实时湖流一体存储引擎的架构设计和研发工作,推动湖流一体在腾讯内部的业务落地。曾在腾讯和字节跳动负责数据湖和流批一体服务的研发工作。

  • 顺丰科技 规划与资源决策算法总监刘子恒
    刘子恒
    顺丰科技 规划与资源决策算法总监

    刘子恒,顺丰科技营运网络智能决策主要负责人,2016年加入顺丰,负责顺丰陆运、航空物流网络的智能决策解决方案搭建工作,从0到1搭建了智慧物流网络决策支持系统,基于海量人、车、货、场数据,集大数据、智能算法、作业平台建设等关键技术于一体,解决场地选址、线路规划、运力资源储备及调配等难题,搭建可视化的端到端智能决策平台,算法与业务融合共生,以帮助数以万计的网络规划、运力规划及调度人员降低决策成本,提升运营效率及质量,已经广泛应用于顺丰各个业务场景。曾获得2025 Franz Edelman Finalist Award等重量奖项。

  • 顺丰科技 大模型高级产品运营经理卢馨婷
    卢馨婷
    顺丰科技 大模型高级产品运营经理

    顺丰科技高级产品运营经理,先后在字节跳动、顺丰同城等多家公司工作,擅长全链路产品运营,通过产品设计*数据运营*组织协同打造增长飞轮。从0到1搭建顺丰科技AIGC产品运营体系,助力大模型产品在物流垂域场景化和智能化,实现降本、增效、增收的业务目标。

  • 顺丰科技 高级算法工程师,浙江大学LLM方向博士后卢玥 博士
    卢玥 博士
    顺丰科技 高级算法工程师,浙江大学LLM方向博士后

    卢玥博士(Dr. Yue Lu),拥有加州大学河滨分校计算机科学博士学位,曾在 SIGKDD、ICDM、DMKD 等国际顶级会议与期刊上发表学术论文 7 篇。她的代表作《Matrix Profile XXIX: C22MP, Fusing catch 22 and the Matrix Profile to Produce an Efficient and Interpretable Anomaly Detector》荣获 ICDM 2023 年度最佳论文亚军。卢玥博士曾与 Amazon、Google、Apple 等科技巨头深度合作,推动时间序列异常检测技术的产业化应用。


    目前,卢玥作为浙江大学与顺丰科技联合培养的 LLM 方向博士后,全面负责网络安全与数据安全业务的前沿技术研究与解决方案设计。她致力于将检索增强生成(RAG)等最前沿技术应用于威胁情报自动化、疑难告警精准定位及海量日志智能审计,助力构建兼具高效性与可解释性的安全大模型平台。

  • 顺丰科技 后端开发高级工程师宋晨川
    宋晨川
    顺丰科技 后端开发高级工程师

    负责顺丰AI平台技术管理以及架构。2018年加入顺丰,从0到1搭建顺丰内部AI平台,解决企业内部AI资源获取以及使用问题,提升资源使用效率;提供工具实现智能业务快速落地,提速创新。大模型时代基于AI平台转向大模型平台,搭建内部Agent平台,模型广场等大模型工具,帮助企业内部快速落地Agent应用。

  • 平安财产保险 数据智能部架构师许璐
    许璐
    平安财产保险 数据智能部架构师

    2015年加入平安,目前负责平安产险大数据基础平台研发管理优化等工作。

  • 位道科技 CTO刘振华
    刘振华
    位道科技 CTO

    毕业于电子科技大学通信硕士,中山大学岭南学院-麻省理工Sloan学院国际工商管理双硕士。


    任职vidau.ai CTO,曾担任腾讯(TME)高级产品总监、盛大创新院云计算产品负责人。14年研发管理与商业化实践经验,目前在AI+跨境出海领域深耕。

    受邀担任广州美术学院AIGC客座教授,阿里国际人工智能孵化中心特聘导师。发表3项专利和10余篇论文,出版了《AIGC数字艺术设计·零基础入门》。

  • 微信 高级安全工程师林伟壕
    林伟壕
    微信 高级安全工程师

    拥有十多年企业安全建设经验,先后在网络安全(电信集团)、运维安全(网易游戏)、研发安全(腾讯)领域深耕多年,参与过百 G 级 DDoS 防护系统、百万级主机入侵检测系统与十亿级代码安全扫描系统建设,目前主要负责数据防泄漏、数据合规技术能力建设,以及安全风险系统化解决。

  • 腾讯音乐 平台产品部高级工程师邹彬
    邹彬
    腾讯音乐 平台产品部高级工程师

    毕业于华南理工大学,主要从事推荐系统开发,目前负责QQ音推荐线上工程及优化。

  • PingCAP TiDB 中国区研发负责人姚维
    姚维
    PingCAP TiDB 中国区研发负责人

    曾在奇虎 360 基础架构组负责开源 MySQL 中间件 Atlas,2012 年创业做过安卓推送系统聚能推。加入 PingCAP 后曾带领 TiDB SQL Infra 组,TiKV 事务组,PD 组等技术团队。2020-2024 年负责 PingCAP 全球开源社区业务,现在负责 PingCAP 中国研发团队。

  • 滴灌通集团 高级技术副总裁 & 首席架构师罗意
    罗意
    滴灌通集团 高级技术副总裁 & 首席架构师

    目前负责滴灌通澳门金融资产交易所数科团队的技术架构与数据智能规划落地。


    疫情期间,在腾讯会议主导账号、运营、商业化等 SaaS 系统研发,成功支撑月活 2 亿 + 的高并发流量。此前在广发证券、uSmart 证券担任架构师及技术合伙人,落地覆盖 A 股、港股、美股的全球行情交易与智能投顾系统,具备丰富的金融科技与 SaaS 数字化系统建设经验。

  • 顺丰 后端开发高级工程师钱亮
    钱亮
    顺丰 后端开发高级工程师

    钱亮负责财务公司核心系统的整体架构设计与建设,包括银行核心系统、监管报送系统、监管数据仓库、财司官网等关键业务系统。主导多个金融级高可用、高并发系统的架构设计与落地,具备12年以上银行、支付及相关金融系统的架构设计与研发落地经验。在智慧社区项目中,负责支付平台的整体架构设计与开发,支撑多场景支付业务,并实现高安全性、可扩展性的服务化架构。


    曾主导旅游电商平台的研发与架构设计,支持景区票务、商品销售、会员体系等多个核心模块,成功支撑高峰期百万级访问量。深耕微服务、分布式架构、中台化设计、数据治理等领域,熟悉Spring Cloud、Kubernetes、AI等主流技术栈。

  • Alluxio 首席架构师傅正佳 博士
    傅正佳 博士
    Alluxio 首席架构师

    本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。

  • 云器科技  联合创始人&CTO关涛
    关涛
    云器科技 联合创始人&CTO

    云器科技联合创始人兼 CTO,曾任阿里巴巴 P10 研究员,主导了阿里云飞天大数据平台二代研发及落地,曾于微软云计算和企业事业部工作近十年,浙江省科技进步一等奖获得者。

  • 亚马逊云科技 首席人工智能专家邓明轩
    邓明轩
    亚马逊云科技 首席人工智能专家

    现任亚马逊云科技大中华区首席人工智能专家,主要负责大中华区架构师团队的技术建设工作,包括前沿技术探索,技术路线设定,架构师技术发展、职业发展等相关工作。

    邓明轩拥有25年IT从业经验。在加入亚马逊之前先后任职于IBM,BlackBerry,Apple等大型企业,从一线开发工程师起步,曾担任售后工程师,售前工程师,软件架构师等不同职位,覆盖大中华区各主流行业。他喜欢新技术,喜欢技术挑战,擅长于新型技术堆栈快速上手,勇于带领团队突入新领域。

  • IDEA 研究院主任研究员、AI4Science负责人李昱 博士
    李昱 博士
    IDEA 研究院主任研究员、AI4Science负责人

    博士毕业于新加坡国立大学,曾是UIUC高等数字科学研究中心研究员、Blackmagic Design资深算法专家、以及腾讯ARC实验室创始成员,长期致力于生成式人工智能的研究与工业界应用落地转化,多项研发的能力进入到工业界顶尖产品中创造实际价值。在AI领域的多个顶级会议(包括CVPR、ECCV、NeurIPS、ICLR和ICML)担任领域主席。迄今为止,已发表60多篇高水平学术论文和期刊文章,谷歌学术引用过万。2022年起连续入选斯坦福前2%科学家榜单。2023年深圳市人工智能自然科学奖获得者。

  • 小红书 交易、基础数仓负责人吴浩亮 (马尔科)
    吴浩亮 (马尔科)
    小红书 交易、基础数仓负责人

    有多年数据架构经验,擅长离线、实时数仓、OLAP 技术和数据湖技术在多场景的实践落地。

  • 云器科技 技术合伙人李睿博
    李睿博
    云器科技 技术合伙人

    云器科技技术合伙人,中国通信学会开源技术委员会委员,致力于分布式系统、大数据平台相关研发工作十余年,曾任阿里云资深技术专家,主导 MaxCompute 湖仓一体研发等工作。2023 年加入云器科技,负责推进公司产品 Lakehouse 的生态构建,Studio 实时化升级等研发工作。

  • 启思码 资深算法专家​李力
    ​李力
    启思码 资深算法专家

    资深算法工程师,负责 OFNIL-GI 平台及解决方案建设,帮助出海客户共创商业化增长解决方案,提升ARPPU 40%+,留存提升 70%+。


    曾任腾讯商业化增长方向高级应用研究员,专注游戏社交推荐与算法研发,曾支撑30+游戏场景。主导或参与腾讯 10+ 游戏的商业化模块及社交模块开发及优化,均有显著提升。


    曾在微信视频号推荐团队,参与视频号推荐算法业务,负责召回算法及特征模块开发。

  • 上海 AI Lab 大模型数据研发专家蒋乾
    蒋乾
    上海 AI Lab 大模型数据研发专家

    负责大模型预训练数据生产,设计和落地 Data + AI 系统架构。

  • 数势科技   CTO韩秀锋
    韩秀锋
    数势科技 CTO

    13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。

  • 深圳证券 数据中心负责人毛瑞彬 博士
    毛瑞彬 博士
    深圳证券 数据中心负责人

    毛瑞彬 博士,深证信息数据中心负责人,研究领域为金融领域大数据与自然语言处理技术,参与科技部和深圳市多项课题研究;获2019年广东省优秀大数据案例TOP 30奖、2020年度中国人民银行金融科技发展二等奖;近年来在自然语言处理和知识图谱方面有多篇论文发表和专利授权。

  • 腾讯云 数据湖存储团队 专家工程师于飏
    于飏
    腾讯云 数据湖存储团队 专家工程师
  • 活动日程
    2025-07-25
    2025-07-26
    2025-07-25
    09:00 -12:20
    主论坛演讲
    2025-07-25
    09:10-09:40

    智领物流变革:基于丰语与丰知大模型的供应链智能决策实践 

    物流与供应链行业面临高可靠性决策需求,通用大模型因缺乏专业知识储备、对结构化数据处理不足,难以满足行业精准需求。顺丰科技基于自研技术,提出行业专属大模型解决方案,旨在通过AI技术提升物流效率与决策智能化。


    顺丰的“丰语大语言模型”(多模态处理)与“丰知物流决策大模型”(结构化数据优化),结合大模型生成能力与小模型专业能力,构建供应链智能体,在需求预测、履约交付和决策优化等场景有显著的技术优势和实际效益。如在客户某装箱场景中,求解速度提升3万倍,总里程减少8%。客服售后处理时长减少30%,国际报关要素自动匹配率达98.2%,实现高精度全球化服务。


    演讲提纲:


    1、业务背景
      - 物流行业痛点:高可靠决策需求 vs 通用模型局限性
      - 顺丰科技目标:打造可控、可信、可用的行业大模型
    2、方案选型
      - 丰语大语言模型、丰知决策大模型
    3、落地挑战
      - 多模态数据融合、实时性要求
    4、解决思路
      - 技术突破:多尺度多通道预测模型、偏好微调
      - 架构优化:供应链智能体分层,集成多模态能力与行业知识
    5、应用价值
      - 业务智能化、决策精准化、规模可扩展
    6、未来规划
      - 国际拓展、技术深化    


    听众收益:

    - 了解大模型在物流垂域的定制化路径——从通用模型局限性到行业专属模型的构建逻辑
    - 了解多模态数据处理与实时决策优化方案
    - 了解“大模型+小模型”协同架构设计(供应链智能体分层),平衡效率与专业性

    嘉宾
    DA数智大会2025 · 深圳站
    唐恺
    顺丰科技 CMO
    2025-07-25
    09:40-10:20

    LLM Agent 开发新范式——自然语言的解析与执行

    从语言的解析与执行的角度分析智能体(Agent)构建的关键要点,讨论大语言模型(LLM)在其中的作用,讨论传统经典程序充当的角色,进一步讨论智能体构建过程中如何结合大语言模型的概率计算和传统经典程序的符号计算,同时结合前沿的工程实践讨论具体的挑战和未来的方向。


    演讲提纲:

    - 自然语言的解析和执行
    - LLM 的语言解析机制和限制
    - LLM Agent 整体思路
    - MCP 如何重塑 Agent 开发
    - 利用 E2B 构建和部署 AI Agents
    - Strands Agents SDK


    听众收益:从一个新的角度理解 Agent,了解前沿的 Agent 工程实践


    落地挑战和方案重点:LLM Agent 在一个快速发展的阶段,我们无法预知未来的挑战和可能出现的新方向,让我们一起了解目前的实践,一起展望和迎接未来的智能时代。

    嘉宾
    DA数智大会2025 · 深圳站
    邓明轩
    亚马逊云科技 首席人工智能专家
    2025-07-25
    10:20-10:40

    构建AI时代的大数据基础设施 

    本次演讲,作为阿里巴巴15年深耕的大数据基础设施ODPS,在Cloud Native 大数据时代,如何深度融合Data与AI能力,构建AI时代的大数据基础设施。

    嘉宾
    DA数智大会2025 · 深圳站
    张治国
    阿里云 智能计算平台事业部 MaxCompute负责人
    2025-07-25
    10:40-11:20

    赋能 AI与AI 赋能的多云统一数据平台

    由于横向部门原因、纵向历史原因、业务出海原因、财务降本需求、业务稳定需求等多种因素,大多数上云的企业都使用了多个公有云。由于公有云的不兼容性,企业不仅面临云孤岛和数据孤岛的难题, 而且业务的跨云迁移都经常需要花费大量人力和时间(一般至少半年)。


    为了应对这些挑战和难题,美的建设了中立云-跨云统一的数字化底座。其技术创新体现在以下几个方面:

    (1)实现了云下云上的统一,即企业自己数据中心和公有云上数字化底座的统一;

    (2)实现了多云的统一,即在多个公有云上面实现了数字化底座的统一;

    (3)实现了云计算的软硬件解耦;

    (4)实现了云上云下资源的统一调度,为企业实现全球一张网,全球一朵云。

    (5)作为操作系统级平台,屏蔽了不同厂商公有云之间的差异,屏蔽了企业数据中心数字化底座与公有云之间的差异;

    (6)应用系统在从企业自己数据中心迁移到任何公有云、以及从任何一家公有云迁移到另外一家公有云的时候,不需要任何业务改造,业界一般需要半年以上的改造期,因为公有云之间不兼容。


    基于跨云统一的数字化底座,美的建设了多云统一的数据平台,包括大数据研发平台、大数据引擎平台、数据库管理平台、数据库引擎平台,以及AI算力平台。这些平台与AI相互赋能,构成了赋能 AI 与AI 赋能的多云统一数据平台。


    演讲提纲:

    - 中立云-跨云统一的数字化底座

    - 赋能 AI 的算力平台

    - AI 赋能与赋能 AI 的大数据平台

    - AI 赋能的数据库平台


    听众收益:从AI角度和多云统一的角度看数据平台的建设


    落地挑战和方案重点:首先,多云统一是业界难题;其次,AI与数据平台的深度融合与相互成就都是业界最前沿的课题。

    嘉宾
    DA数智大会2025 · 深圳站
    刘向阳 院士
    美的集团 首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow
    2025-07-25
    11:20-12:00

    Big AI Data时代下,小红书数据架构的演进

    2022年随 LLM/AGI 的革命性突破,数据平台迎来了第三次革命,半非结构化数据的处理能力被AI解锁,数据规模再一次触碰10倍扩展的潜力。


    数据平台从业者开始面临两两方向的挑战:
    - 已有数据平台架构仍有诸多挑战,如何升级,例如 Lambda 架构复杂、海量数据的处理低效;
    - 新兴AI架构有诸多新的新需求,如何构建,例如半非结构化数据的组织和管理、CPU/GPU 混合负载、Al-ready 服务层如何构建;

    因此,从业者的普遍疑问是,新一代 Data+Al Infra 如何设计,效率倍增?哪些架构需要改造或者新增,以满足新的需求?

    本次演讲,将从小红书数据架构演进视角,论述新一代架构的设计,并联合云器科技CTO关涛,探讨 Data+Al Infra 设计的变与不变。


    演讲提纲:

    1. 小红书数据架构概述
    2. 基于增量计算的下一代架构升级选型与思考
    3. 从Big Data 到 Big Al Data,D+A infra 架构设计的变与不变


    听众收益:

    - 了解小红书数据架构的现状和演进思路
    - 了解当前主要趋势与挑战
    - 了解和探讨,新一代 Data+Al Infra 的设计思路

    嘉宾
    DA数智大会2025 · 深圳站
    吴浩亮 (马尔科)
    小红书 交易、基础数仓负责人
    DA数智大会2025 · 深圳站
    关涛
    云器科技 联合创始人&CTO
    2025-07-25
    14:00 -17:40
    DataAgent:从辅助分析到自主决策(出品人:乔红麟)
    2025-07-25
    14:00-14:45

    DataLab:一站式数据科学智能体的构思与挑战 1408007663617065.png资源 5@4x.png

    数据科学分析流程涉及取数、加工、可视化等多个阶段,依赖跨角色协作与多工具切换,而传统数据智能体聚焦单任务场景,难以应对企业级复杂需求。


    DataLab通过整合LLM规划能力与混合编程Notebook界面,通过三大核心模块实现一站式数据科学智能体:

    领域知识自动化生成:利用脚本与数据血缘构建知识图谱,提升NL2SQL等任务准确率;

    结构化通信机制:基于有限状态机(FSM)实现多Agent高效协作;

    上下文自适应管理:基于Notebook动态管理上下文,提升协作效率。


    演讲大纲:

    1. 业务背景

    1.1 数据科学智能体痛点:跨角色协作断层、工具孤岛、领域知识缺失

    1.2 LLM在数据科学中的局限与潜力:单任务优化 vs. 全流程统一

    2. 方案选型

    2.1 架构设计:LLM代理规划框架 + 混合编程Notebook

    2.2 核心模块:领域知识增强、多Agent协作、Notebook上下文管理

    3. 落地挑战

    3.1 挑战1:企业级数据表语义歧义(如“prod_class4_name”映射“收入”)

    3.2 挑战2:多模态信息共享冗余(SQL结果传递至可视化代理)

    4. 解决思路

    4.1 知识生成:基于脚本历史的Map-Reduce式自动化提炼

    4.2 通信协议:结构化信息单元(Data Source/Role/Action)与共享缓冲区

    4.3 上下文优化:依赖图剪枝与任务类型适配

    5. 未来规划

    5.1 Human-in-the-loop的方式增强自动化数科解决方案的成功率

    6. 总结

    DataLab的价值:统一流程、企业级知识沉淀


    听众收益:

    1. LLM如何从单任务工具升级为全流程协作平台,打破角色与工具边界。

    2. 企业级数科场景下领域知识自动化生成的设计范式。

    3. 基于Notebook的混合编程平台以及上下文管理策略。

    嘉宾
    DA数智大会2025 · 深圳站
    侯忱
    腾讯大数据 算法研发工程师
    2025-07-25
    14:55-15:40

    Data Agent智能决策引擎:数势科技在NL2Semantics与Multi-Agent架构上的革新与业务实践

    传统 BI 依赖人工取数和报告生成,面临效率低、误差高、决策滞后等痛点。数势科技 Data Agent 通过 Multi-Agent 架构实现任务自动分解与协作,以 NL2Semantics 层和 Multi-Agent 架构解决企业数据分析中的关键痛点,例如数据语义歧义、复杂任务分解和个性化决策支持等。在金融场景中,数势科技 Data Agent 能并行处理数据查询、归因分析和报告生成,将分析周期从小时级压缩至分钟级。

    嘉宾
    DA数智大会2025 · 深圳站
    韩秀锋
    数势科技 CTO
    2025-07-25
    16:00-16:45

    构建基于大模型和Agent的自动数据分析平台实践

    在特定的业务场景中,数据分析往往需要大量的人工介入。一方面业务场景和业务经验对于有效的分析切入角度和流程至关重要,另一方面,也需要对数据源价值和局限性有清晰的认识。


    为了提高在这些场景下的数据分析效率和质量,我们提出一种基于大模型和Agent的分析流程和平台。一方面平台提供了固化的工具和定期执行的通道,另外人工经验可以有效的嵌入这个平台,从而全方面提升数据分析的效果。

    嘉宾
    DA数智大会2025 · 深圳站
    陈嘉 博士
    Grab Head of Data Science, Integrity and Core Experience
    2025-07-25
    16:55-17:40

    Ofnil:Agent和智能图平台在游戏行业应用实践 1405460843617065.png

    演讲提纲:

    1. Ofnil 产品整体介绍
    2. Flavius 湖仓一体架构
    3. HiRAG 创新及应用
    4. Ofnil 中 AI Agent 的应用方案
    5. Ofnil 在游戏行业的应用实践



    听众收益:

    1. 收获AI Agent 在游戏行业的应用实践。
    2. 收获游戏运营增长解决方案在出海案例中的落地实践。


    落地挑战和方案重点:

    1. 如何借助 AI Agent 能力,为游戏客户提供定制化运营及干预建议。
    2. 商业化应用案例及增长方案,如何更好的规模化等。

    嘉宾
    DA数智大会2025 · 深圳站
    ​李力
    启思码 资深算法专家
    2025-07-25
    14:00 -17:40
    AI搜索技术探索与应用(出品人:马宇翔)
    2025-07-25
    14:00-14:45

    芝麻企业助手中的Deep Research应用实践 

    在芝麻企业助手中企业分析、行业研究场景中,面临数据量级数十亿、数据结构复杂、结果要求精确、响应要求快、结果要求准、产品整合度高的难点下的方案设计及方案中对Deep Research的研发和应用经验。


    演讲大纲:

    1. 芝麻企业助手中应用Deep Research的相关场景和能力介绍

    2. AI Search的技术路线演进和当前主流方案的分析

    3. 芝麻企业助手场景下各难点的拆解和方案落地案例

    4. AI搜索等大模型商业化后续发展路线观察


    听众收益:

    - Deep Research业界方案的系统性分析

    - Deep Research的理论如何结合实际做针对性改动以解决问题的案例介绍

    - 在模型即产品的趋势下,技术细节对业务方向如何产生影响

    嘉宾
    DA数智大会2025 · 深圳站
    马宇翔
    蚂蚁集团企业信用部算法负责人
    2025-07-25
    14:55-15:40

    运用 Elasticsearch 进行向量搜索及创建 RAG 应用

    传统的词汇搜索不能满足当今时代的需求,特别是在这个智能的时代。当今企业需要能够理解人类意图的语义搜索,也就是根据文字的语义来进行搜索,而不是简单的词汇匹配。另外,我们也需要针对其它的数据类型,比如图片,语音及视频等来进行搜索。


    Elasticsearch 自 8.0 开始提供向量搜索(密集向量及稀疏向量),它可以完美地解决文字语义搜索及对多媒体数据的搜索。此外,向量搜索也并非完美,在很多时候也缺乏可解释性,特别是针对文字搜索。我们可以使用混合搜索(词汇搜索,向量搜索)进行多路召回并对最终结果进行排名。这种方法大大提高了搜索的精度及召回率。


    随着 Elasticsearch 版本的不断演进,性能不断完善,并且使向量搜索的成本不断降低。目前,Elasticsearch 可以为百亿级数据提供生产级的部署。在人工智能发展的今天,结合大模型,使用 GenAI 可以让我们得到完美的推理答案。


    由于企业数据或私有数据在每时每刻都在生成,大模型也不可能每时每刻更新。大模型在缺乏上下文的情况下进行推理,在很多的时候会产生幻觉,因为这些知识不存在于大模型中。结合 Elasticsearch 的向量搜索技术针对企业数据或私有数据进行搜索,把搜索结果作为上下文提供给大模型,从而消除幻觉。这种技术也被称作为 RAG(检索增强生成)。


    本议题将详细介绍 Elasticsearch 的向量搜索技术,技术更新及如何使用它进行 RAG 的应用开发,并展示如何超越传统的 RAG。


    演讲提纲:

    1. 智能时代的搜索需求

    对语义搜索的需求,而不是简单的词汇匹配

    对多媒体数据的搜索,比如图片,声音及视频

    非结构化数据的搜索

    向量搜索带来的新的解决方案

    2. Elasticsearch 向量搜索介绍

    向量搜索原理

    向量搜索种类(密集向量,稀疏向量)

    混合搜索介绍(多路召回,综合评分)

    Elasticsearch 在向量搜索上的最新进展

    3. RAG 实现原理

    如何使得大模型变得更聪明

    RAG 的实现方法

    4. 使用 Elasticsearch 在企业搜索中的案例分享

    高级 RAG 案例分享

    Agentic RAG 案例分享


    听众收益:

    - 开发者充分了解 Elastic 所提供的向量搜索(密集向量及稀疏向量)

    - 如何使用向量搜索及传统搜索来提高搜索的召回率及精度

    - 展示 Elasticsearch 在向量搜索方面的最新更新以及 RAG 在企业搜索应用的的实现

    嘉宾
    DA数智大会2025 · 深圳站
    刘晓国
    Elastic 首席布道师
    2025-07-25
    16:00-16:45

    RAG 技术全景:实时检索与可控生成的前沿实践

    在大规模语言模型(LLM)应用中,“幻觉”现象显著制约了模型的可信度和实用性。检索增强生成(RAG)技术通过引入外部知识源,显著提升了模型的事实准确性;但如何在生成过程中实现“边写边查”,并将检索到的信息高效融入生成流,是进一步优化模型精度与响应效率的关键所在。


    本次分享将全面梳理 SOTA RAG 技术框架:从静态一次性检索机制到生成中动态触发检索,再到生成控制策略——包括检索–生成联合训练、架构级增强(跨层交叉注意力与知识适配器)以及解码期约束(概率重加权与硬规则校验)。本演讲将系统呈现最前沿的 RAG 技术思路与实现方法,帮助技术同仁深入了解这一领域的核心进展。


    演讲提纲:

    一、背景:RAG在网络安全等高准确性场景下的重要价值

    二、传统RAG的技术局限性
    1. 一次性检索策略:缺乏生成上下文感知能力
    2. 检索与生成割裂:缺少训练联动机制
    3. 缺乏一致性保障:生成内容易偏离知识来源

    三、RAG的优化方向与关键维度
    1.检索策略:从批处理到动态触发
    1.1 静态检索代表:RAG-Token、REALM
    1.2 动态检索代表:RETRO(分块)、Self-RAG(\[Retrieve] token)、DRAGIN(注意力驱动)
    1.3 对比分析:检索精度、上下文利用率

    2. 生成控制机制
    2.1 检索生成联合训练:知识与生成耦合紧密、检索质量可自适应优化
    2.2 架构增强机制:隐层融合-交叉注意力引入检索表示
    2.3 解码一致性约束:概率重加权-结合检索文档相关性调整 token 采样分布

    四、代表技术方法详解(2-3 个 SOTA RAG方法)
    1. Self-RAG:学习何时触发检索、是否使用已有知识
    2. FLARE / DRAGIN:基于置信度或注意力的动态检索触发与查询生成
    3. DeepRAG:生成链控制与子查询分解

    五、总结
    1. 总结各维度技术演进路线
    2. 未来方向


    听众收益:

    - 如何灵活选择检索策略:掌握静态数据库与实时检索的区别,学会根据业务需求选择最佳组合方案
    - 提升AI可信度的关键技术:通过检索与生成的联合训练方法,结合算法调整和规则约束,减少结果错误
    - 系统优化的完整路径:从前沿技术案例(如Self-RAG)中学习从模型优化到系统升级的实用改造思路

    嘉宾
    DA数智大会2025 · 深圳站
    卢玥 博士
    顺丰科技 高级算法工程师,浙江大学LLM方向博士后
    2025-07-25
    16:55-17:40

    从“字”到“画”:基于Elasticsearch Serverless 的多模态商品搜索实践 

    大模型技术最近引来一波蓬勃发展,模型能力增强后,很多场景得以实现,原来还处于DEMO阶段的产品,迎来了从概念验证到真正落地的关键转折。包括代码编程,图片理解,图文检索等领域实现功能突破和用户体验的指数级提升。


    大模型的发展速度很快,一夜之间这些模型就学会了新的技能,从辅助写作到代码coding,再到数据分析,几乎触及了生活的方方面面。高速的发展,让大家开始感到不安,我们开始担忧自己的工作会不会被AI取代。这给我们带来了一些挑战:一方面需要快速拥抱AI,尝试用AI给自己的工作提效;另一方面,创新能力变得越来越重要,在创造性这件事情上要投入的时间会越来越多,我们的重点要从单纯的技能掌握转变为创新能力的培养。


    大模型正在重塑传统行业的一些底层逻辑,从“经验驱动”到“智能决策”的变化已成趋势,希望能看到大模型赋能千行百业,助力传统行业智能化升级,帮助企业提升效率,降低成本,开辟新的商业模式。

    嘉宾
    DA数智大会2025 · 深圳站
    刘松
    阿里云 搜索技术专家
    2025-07-25
    14:00 -17:40
    Data+AI 一体化平台架构实践(出品人:成峰)
    2025-07-25
    14:00-14:45

    Data+AI在金融业数据治理体系升级实践 资源 1@4x.png

    本次演讲分享Data+AI在平安产险大数据团队的实践,通过构建智能化数据服务体系,拟解决当前业务用数效率低,开发成本高,数据复用难等痛点。核心将围绕“作数~用数~管数”全链路革新,推动业务人员自助用数、数据开发效率提升及数据治理体系升级,最终实现数据使用平民化,数据资产价值最大化。


    演讲提纲:

    1. 现状与痛点剖析

    2. 核心解决方案

    3. 产品规划蓝图

    4. 实施路径

    5. 总结与展望


    听众收益:了解大模型下企业数据模式会发生哪些变化

    嘉宾
    DA数智大会2025 · 深圳站
    许璐
    平安财产保险 数据智能部架构师
    2025-07-25
    14:55-15:40

    AI 时代阿里云大数据技术演进与发展

    主题围绕AI时代大数据技术的演进方向,计算模态和数据模态的发展展开。叙述从CPU到云原生异构计算(GPU/xPU)、结构化到多模态数据的转型,并通过AI Agent等手段实现智能化开发与交互的能力,内容涵盖 MaxCompute、Hologres、DataWorks、PAI等阿里云大数据及AI全栈产品矩阵的产品整体策略。

    嘉宾
    DA数智大会2025 · 深圳站
    赵弘扬
    阿里云 高级产品专家
    2025-07-25
    16:00-16:45

    Pinterest在大语言模型数据处理上的最后一公里技术实践

    案例将简述 Pinterest 为大模型训练搭建的数据预处理平台。先简单介绍之前公司内部基于 Spark,PyTorch 等构建的数据 pipeline,我们发现不仅浪费开发人员的研发时间,而且训练资源吞吐率不高,特别是 GPU 的使用率一直很难提高。核心问题在于需要同时管理异构资源的 framework,包括 CPU和 GPU,而且在海量数据进行 batch inference 的时候,需要 Streaming Processing 和 Distributed Scheduling。


    在广泛的考察和比较之后,我们采用了基于 Ray搭建的数据预处理平台,为开发人员带来了极大的便利,并显著提高了资源利用率。Ray可以同时管理 CPU和GPU,具有大数据 Streaming Processing 的特点。在Ray的基础上,我们开发了Multi-Model Inference,CarryOver Columns,Accumulator 等实用工具。


    现在,我们的新一代数据预处理平台已经推广到公司的几十个机器学习组,每天上线50个以上的 Batch Inference 工作。


    听众收益:

    - 了解 Pinterest 作为全美排名前三的社交网络公司,如何进行大模型的部署和应用;

    - 在大模型部署过程中,解决数据预处理的瓶颈;

    - 了解 Ray 作为行业领先的大模型数据处理平台,在企业中的应用;

    - 数据部门如何与深度学习部门进行合作,优化公司的大模型部署和运营;

    嘉宾
    DA数智大会2025 · 深圳站
    罗震霄 博士
    Pinterest Sr. Staff Software Engineer
    2025-07-25
    16:55-17:40

    AI 浪潮下的数据开发变革:Grab 的 Data Mesh 落地与数据开发自动化 1405460843617065.png

    在AI浪潮驱动下,Grab的敏捷数据开发成为赋能业务增长和AI应用(如AI BI,Embedding, RAG)的关键基石。本次演讲将深入探讨Grab在构建面向未来的数据基础设施上的投入,以及我们在落地Data Mesh复杂架构中遇到的挑战与应对策略。核心亮点在于,我们将重点解析数据契约(Data Contract)在提升数据开发效率和跨团队协作中的革命性作用,它如何让数据生产者实现自主发布,消费者获得明确依赖。


    最后,我将介绍Grab如何结合 AI 助手 (如Cursor),内部平台能力 (MCP),及数据质量API,自动化并优化数据生产链条,显著提升数据交付速度和数据资产可信度,为Grab的“数智化”转型提供坚实数据底座。


    演讲提纲:

    1. 数智浪潮下的数据开发转型:背景与战略选择

    2. Data Mesh 落地实践:AI 驱动的自动化、质量与生产力飞跃

    3. 持续演进与未来展望


    听众收益点:

    - 理解 Data Mesh 架构的深层价值与实践挑战
    - 掌握数据契约(Data Contract)的设计与应用精髓
    - 获得构建智能化、可靠数据平台的系统化视角
    - 启发数据团队转型与协作优化的新思路

    嘉宾
    DA数智大会2025 · 深圳站
    成峰
    Grab 数据基础设施平台负责人
    2025-07-25
    14:00 -17:40
    大模型时代数据处理技术应用(出品人:李海军)
    2025-07-25
    14:00-14:45

    阿里国际多模态大模型数据质量评估与合成技术探索 1408007663617065.png

    在大模型时代,数据是驱动大模型的能源。互联网公开数据作为核心训练资源,正面临随模型规模扩大而趋于枯竭的困境。多模态数据处理需投入高昂的计算成本及人工标注资源,进一步制约模型迭代效率。通过利用现有大模型的生成能力,可在有限算力下自动化合成高质量多模态训练数据,构建"数据生产-模型进化"的协同优化闭环,这将成为突破当前数据瓶颈、实现持续创新的关键路径。


    我们从复杂性、质量、多样性等多个维度出发,定义并构建一套评估多模态数据质量的评估方法,在此基础上探索系统化的方法来合成复杂、多样性的多模态大模型训练数据,从而形成从开源数据采集->数据质量评估->数据合成->模型训练与评估的闭环链路,能够不断迭代创建更多高质量多模态数据以加快模型迭代速度。


    演讲提纲:

    1. 多模态大模型数据现状

    2. 多模态大模型数据质量优化

    3. 多模态大模型数据合成探索

    4. 数据-模型联动机制

    5. 未来探索方向


    听众收益:

    - 了解从多模态数据质量评估、数据合成到模型训练与评测的全流程数据生产链路

    - 了解多模态大模型数据合成的系统化方法与实战

    嘉宾
    DA数智大会2025 · 深圳站
    赵健杉
    阿里国际 AI Business多模态数据负责人
    2025-07-25
    14:55-15:40

    智能文档时代:多模态大模型驱动的数据处理与治理革新

    聚焦于“大模型时代”下的数据处理技术演进。通过对传统 OCR 方案与多模态大模型 (Vision‑Language Models, VLM) 的系统对比,结合最新 benchmark 数据及落地案例,帮助听众全面理解:

    - "训练成本与迁移适用性"的差异

    - 多模态模型在"结构化信息提取"上的突破

    - 混合管线 (OCR + LLM) 的最佳实践

    - 未来在私有化部署、Agent 编排、多模态 RAG等方向的技术落地路线图


    演讲提纲:

    1. 背景与痛点

    2. 传统 OCR 技术栈概览

    3. 多模态大模型崛起

    4. 训练成本 & 迁移能力对比

    5. 公开基准 & Leaderboard 成绩

    6. 多模态模型的优势

    7. 局限与挑战

    8. Hybrid Pipeline:OCR + LLM 最佳实践

    9. 行业落地案例

    10. 未来趋势与技术路线图


    听众收益:

    - 洞察差距:了解传统 OCR 与 VLM 在准确率、成本、灵活性上的核心差异

    - 选型指南:掌握基于公开 benchmark 的模型评估方法与指标

    - 落地思路:获得构建 Hybrid Pipeline、RAG、私有化部署的可行路径

    - 决策支撑:量化投入与 ROI,制定阶段性实施计划

    嘉宾
    DA数智大会2025 · 深圳站
    刘超
    矩阵起源 AI平台研发负责人
    2025-07-25
    16:00-16:45

    从业务价值视角有效构建高质量数据的方法和实践

    在数字化时代,数据是企业核心资产,数据质量关乎企业生存发展,数据驱动决策成主流,但全链路数据质量问题是企业严峻挑战。


    大数据、AI、云计算技术发展使数据量激增、类型复杂,市场竞争加剧让企业需精准数据分析,低质量数据会致决策错误、企业竞争力下降。


    大模型时代,高质量数据是大模型训练的基石,也是行业场景化应用成功落地的关键。高质量数据不仅是技术竞争的“护城河”,更是推动社会智能化升级的战略资源。企业需以业务价值为导向,构建覆盖数据全生命周期的治理体系,同时借力政策与技术创新,实现从“数据成本”到“数据资产”的跃迁。未来,随着标准化、智能化技术的普及,高质量数据将加速赋能千行百业,成为人工智能持续突破的核心引擎。


    实际在企业内部数据全链路生态系统中,因部门壁垒、技术差异、数据标准不统一等,数据常出现缺失、错误、不一致等质量问题,影响分析准确性、业务流程,带来业务损失。高质量数据的工作重要性虽有行业共识,但如何有效关联和支撑到业务价值却并非有广泛共识,另外,如何有效进行数据质量提升也是一个经常会困扰大家的问题,这导致很多企业投入了很多资源做数据质量相关工作的结果并不见效ROI不高,得不到更多的支持与认可。


    本演讲题目旨在通过业务价值导向,建立业务价值和数据质量的映射,进行全链路数据质量提升,保障数据在各环节的稳定性和高质量,实现 “数据高质量→决策高精准→业务高收益” 的闭环。


    演讲提纲:

    1- 新时代的数据挑战与破局

    背景与痛点

    破局思路


    2- 理论框架:价值驱动数据质量提升 VDDQI(2-4-X)

    框架介绍

    落地建议


    3- 关键方法与技术

    业务价值流与数据流剖析方法

    业务价值与数据质量映射引擎

    全链路数据质量提升方法

    价值验证方法


    4- 业务场景实践案例


    听众收益:

    - 分享基于业务价值导向的思维方式,学会将数据质量提升与企业战略和业务目标紧密结合。

    - 分享从全链路视角出发,保障数据在各环节的稳定性和高质量,支撑企业战略决策和业务发展。

    - 熟练掌握提升数据质量的有效方法与实践技巧,能运用并解决实际工作中的复杂数据质量问题。

    嘉宾
    DA数智大会2025 · 深圳站
    易龙
    vivo 互联网 大数据专家
    2025-07-25
    16:55-17:40

    AI4Data 在大模型数据生产中的应用与实践 

    大模型的兴起掀起了人工智能的热潮,Data4AI 的应用场景也日益受到关注。在这个背景下,我们设计和搭建了一套 Data + AI 的系统架构,用 AI4Data 的方式来完成 Data4AI 的目标。


    我们从数据的采集、接入、分类、标注、合成、检索、训练、存储等各个环节进行深入分析,结合数仓组织数据的思想,设计和搭建了一套数据不间断生产的基础设施。在支持数据快速生产和迭代的同时,满足各个团队任意时间段的取数用数需求。


    演讲提纲:

    1. 数据生产的发展历程

    2. 数据生产方式,从 Data4AI 走向 AI4Data

    3. 数据生产链路中的主要工具

    4. 数据组织方式提升数据交付效率

    5. 未来探索方向


    听众收益:

    - 了解数据生产的范式,用 AI4Data,来完成 Data4AI

    - 了解大模型训练数据的生产链路和系统架构

    - 了解高效的数据组织方式,能够提升端到端生产数据的效率

    嘉宾
    DA数智大会2025 · 深圳站
    蒋乾
    上海 AI Lab 大模型数据研发专家
    2025-07-25
    14:00 -17:40
    降本增效:数据架构技术迭代实践(出品人:孙建业)
    2025-07-25
    14:00-14:45

    小米基于 Gravitino 在 Data / AI 数据管理和处理中的实践 1405460843617065.png

    演讲摘要:小米随着业务发展面临多计算引擎难协同、表格数据 / 非表格数据的元数据分散管理、数据治理难度大等问题;此外,AI 领域需处理海量非表格数据及 LLM 训练中的中间数据,传统方法较难满足处理、存储和协作需求。


    在此背景下,小米先后基于 Metacat 和 Apache Gravitino 构建统一元数据中心,实现表格元数据统一管理。针对非表格数据,引入 Gravitino Fileset,结合 JuiceFS 云上存储,提高 Data / AI 场景非表格数据流转效率,并压缩数据存储成本。


    针对 LLM 数据处理场景,通过 PySpark、Spark SQL 和 Ray 结合 Fileset 实现非表格数据高效分布式处理。


    演讲提纲:

    *小米统一元数据中心实践;

    小米数据湖平台架构演进过程;

    小米基于 Metacat 统一湖仓元数据实践;

    小米引入 Gravitino 的背景和基于 Gravitino 构建元数据中心的实践;


    *小米 Data / AI 跨场景利用 Gravitino Fileset 实现非表格数据统一管理的实践;

    Fileset 基本概念和技术原理;

    小米业务接入和迁移 Fileset 的实践;


    *小米 LLM 业务利用 PySpark 和 Ray 结合 Fileset 进行大规模非表格数据处理的实践。

    小米某 LLM 业务的非表格数据处理需求和场景;

    小米某 LLM 业务利用 PySpark 和 Ray 结合 Fileset 进行数据处理的实际案例;


    *未来规划

    探索 Gravitino 进一步的数据、资源管理能力;

    探索 AI 多模态数据管理方案;


    听众收益点:

    *了解小米如何接入 Gravitino 构建统一的元数据湖

    *了解小米 Data / AI 业务非表格数据管理的相关实践

    *了解小米结合 Gravitino Fileset 大模型业务数据处理的相关实践

    嘉宾
    DA数智大会2025 · 深圳站
    肖杰宝
    小米 软件研发工程师
    2025-07-25
    14:55-15:40

    StarRocks 在滴滴的湖仓一体化实践 1405460843617065.png

    从2023年引入 StarRocks 存算一体架构,在滴滴落地实践已经有2年,我们从2.1不断升级到目前稳定在2.5版本,为社区累计贡献了30+的PR,在这个过程中我们积累了大量的经验。


    StarRocks 目前已经承载了滴滴近实时的所有查询场景,每日总查询量达到1亿7000w,StarRocks 全面覆盖了网花顺等网约车核心报表/看板场景,为两轮车/能源/金融等业务也提供了数据产品能力,例如使用 StarRocks 为金融风控场景使用总 530core 计算 CPU 解决了实时近400+QPS的高并发查询场景,使用 StarRocks 为 OMEGA 标签场景单 SQL 查询1PB数据耗时 TP95 稳定在1s的大数据量查询场景。


    滴滴火眼项目用以保障网花顺实时观测指标从接入 StarRocks 后经过430/930等节假日高 QPS 场景均能稳定运行,在此就不一一赘述,近2年的落地实践足以证明 StarRocks 完全有能力替换掉 Presto,并且取得更好的收益。


    演讲提纲:

    1、业务背景:滴滴内部基于 Presto 的使用主要是 Ad-Hoc 查询和报表查询

    2、方案选型:基于查询稳定性和运维稳定性考虑我们决定将国内和美东总共10+的集群迁移至 StarRocks

    3、落地挑战:Presto 和 StarRocks 存在着大量的语法语义差异,我们为了兼容这种差异性,总共提交了30+的PR完成兼容性开发

    4、收益成效:查询性能提升至少5倍 / 减少30%的机器成本 / Presto 集群全量停服


    听众收益:

    1、可获得滴滴在 StarRocks 湖仓使用上的经验总结

    2、可先一步了解滴滴对于 Presto 迁移上的所有架构设计

    嘉宾
    DA数智大会2025 · 深圳站
    林雨
    滴滴 资深大数据研发工程师
    2025-07-25
    16:00-16:45

    微信大数据作业规模化上云的优化实践 1405460843617065.png

    随着云计算、大数据和人工智能技术的发展以及对这三种技术的综合应用需求,同时得益于容器化带来的快速部署,快速迭代以及云计算在资源成本和弹性伸缩方面的天然优势,以Kubernetes 为代表的云原生编排框架通过优秀的抽象和强大的可扩展性,将应用层与 IaaS 层解耦,吸引了越来越多的大数据和AI应用在其上面部署运行。


    微信大数据平台从2020年开始上云相关基础建设,通过系统性优化和架构改造解决上云过程中系统在高性能、高可靠、易维护等方面的挑战。经过4年的发展,实现了大数据、AI作业全面上云。现已将 Flink、Spark、Tensorflow、MPI、Pytorch 等开源和自研等超过10+大数据、AI框架作业迁移云上,为大数据场景提供高稳定性、高性能的云原生底座。


    演讲提纲:

    1、微信大数据平台资源管理演进历程

    痛点:大数据上云的"死亡之谷"

    性能崩塌:大数据作业短期爆发式提交的系统响应延迟与崩溃

    运营黑盒:作业提交延迟,调度吞吐不足等制约业务扩展

    2、破局:全链路优化改造

    易维护:

    可观测与告警

    审计& Event持久化

    高可靠:

    限流和熔断

    数据拆分

    垃圾数据回收

    框架适配

    高性能:

    APIServer优化

    编排优化

    调度优化

    ETCD 优化

    3、优化效果

    4、未来展望


    听众收益:

    - 深度分析大规模大数据作业对 Kubernetes 架构的挑战,从实际问题出发,提出涵盖系统稳定性、性能优化、容灾及可观测性建设的全链路解决方案。

    - 优化后在系统吞吐、作业支持量和稳定性等方面的显著提升,对从事相关工作的具有一定的参考意义。

    嘉宾
    DA数智大会2025 · 深圳站
    吴乾豪
    腾讯 微信事业群技术架构部高级工程师
    2025-07-25
    16:55-17:40

    AI 驱动下的数据系统演进:从存储为中心到多模融合的技术实践

    深入探讨在 AI 驱动下数据系统如何逐渐从传统的“存储为中心”向“多模融合的调度中心”转型。剖析 AI 技术在底层数据组织方式、存取路径和调用模式上的实际变革,详细阐述具体的技术挑战及应对策略。


    结合真实案例,如 TiDB 的 GraphRAG 技术、向量搜索与混合 Ranking 的实际部署与应用,展示如何构建支持智能交互与实时数据分析的高效数据系统。


    提供针对 AI 应用开发的数据库优化实践方法,包括向量索引、HNSW 算法优化及敏捷部署模式(实现快速部署、灵活扩展与跨节点无缝切换),帮助企业快速适应 AI 时代的实际需求,降低技术实施成本,实现技术有效落地。


    演讲提纲:

    1. AI 时代数据系统的发展背景与挑战

    - 传统存储中心数据系统的瓶颈与局限

    - AI技术对数据组织、访问路径与调用模式的重塑


    2. 数据系统从存储为中心到多模融合调用为中心的演进路径

    - 技术变革:结构化与非结构化数据的融合

    - 向量搜索、GraphRAG与混合Ranking技术的应用


    3. 数据库技术优化与敏捷部署实践

    - 向量索引、HNSW算法的深度优化方法

    - 小规模集群的敏捷模式部署与扩展案例分析


    4. 企业落地实践案例分享

    - TiDB的实际应用场景与技术实施经验


    听众收益:

    - 了解 AI 时代数据系统技术演进的具体路径

    - 学习多模态数据处理与技术融合的实践经验

    - 掌握实际部署优化方法论,推动自身技术方案的落地

    嘉宾
    DA数智大会2025 · 深圳站
    姚维
    PingCAP TiDB 中国区研发负责人
    2025-07-26
    09:30 -12:05
    Agentic 前沿技术(出品人:陈迪豪)
    2025-07-26
    09:30-10:15

    顺丰Agent平台企业落地之道

    AI智能体在顺丰发展的很快,在物流场景上有许多实际落地,背后需要许多企业级的Agentic工具支撑;顺丰在内部实践了许多工具,比如Dify,Langchain,Swarm,AutoGen,甚至自研Agent框架。内部围绕这些工具的模型API,Agent平台都做了关键的稳定性优化以及性能优化路径设计以及落地。


    顺丰科技的AI技术平台团队也针对以上工具做了不少企业级特性的增强,同时我们也积极拥抱新技术的演进,在MCP,A2A等场景上在工具层也支撑了不少新模式,新特性,让应用能快速的跟新技术能够对应上,同时保证稳定性以及性能上有较大的提高,适配企业内部智能化演进需求。


    演讲提纲:

    1. 背景
    - 顺丰内部Agent工具应用的场景,大规模落地Agent应用的痛点
    2. 实践与规划
    - 应对大规模落地的顺丰实践方案
    - 目前已解决的问题,Agent平台的规划
    3. 应用端落地
    - 企业级特性介绍,如何利用这些特性快速实践应用的AI演进


    听众收益:

    - Agent工具在业务场景结合的案例
    - Agent工具企业级内部应用的痛点以及解法

    嘉宾
    DA数智大会2025 · 深圳站
    宋晨川
    顺丰科技 后端开发高级工程师
    2025-07-26
    10:25-11:10

    跨越鸿沟,Agentic AI产业落地方法与实践

    结合AI产业实践落地的经验,以一个国风珠宝品牌品牌营销为案例,从一个全新的视角思考 Agentic AI 如何在产业落地,以及落地过程中的架构思考,Data + AI 所遇到的技术挑战以及解决思路。跳出技术看业务,然后再回归工程技术的落地。


    演讲提纲:

    一、AI在产业落地的困境

    信息鸿沟,思维差异,效果落差共同造就了产业落地的困局

    - 大众与专业人士之间的信息鸿沟

    - 普通大众与专业人士之间的信息鸿沟

    - AI科普与AI产业落地之间的现实落差

    - 从历史看未来 - Agentic AI 产业落地的真实形态


    二、新的视角来思考 Agentic AI

    跳出软件的视角,以人的视角来看待 Agentic AI,思考业务落地的正确姿势

    - 从“人”而非“程序”的视角看待 Agentic AI

    - TA是“虚拟员工”,而非 Copilot 工具

    - 工具不是为人开发,而是为 AI Agent 开发

    - Toolkit + 业务 Knowhow 注入 + 反馈学习


    三、Agentic AI 品牌营销落地实践

    让 Agentic AI 成为营销团队里的‘超能同事’,助力小团队也能玩转大市场

    - 品牌营销痛点洞察

    - 核心业务流程拆解 - 确定可行性

    - Agentic AI 落地形态:从可行性到突破点

    - Agentic AI 落地核心技术支柱

    - 技术之外,更需要业务 Knowhow 赋能 Agentic AI

    - Agentic AI 落地的关键技术以及挑战

    - Agentic AI 实现成果展示



    四、Agentic AI 在产业落地的几点思考

    跳出工具思维,以“人”的交流思考业务重构以及人与AI 的协作

    - 我们角色 - AI的“培训师”

    - 业务方如何拥抱 Agentic AI


    听众收益:

    - 学会从产业+产品形态+技术融合的视角来看待AI

    - 了解企业私有的 Data + AI 在落地过程中的挑战与实践经验

    嘉宾
    DA数智大会2025 · 深圳站
    刘永峰
    云启星辰 联合创始人&CTO
    2025-07-26
    11:20-12:05

    加速 Agentic Memory:在 PB 级数据湖上实现 Parquet 查询 1000 倍性能提升

    在 Agentic AI 技术迅猛发展的当下,Agentic Memory 作为支撑 AI Agent 自主决策、持续学习的核心基础,其性能直接决定了 Agent 的响应速度与智能水平。当前,PB 级 Parquet 数据湖已成为 Agentic Memory 的主流存储载体,但基于云对象存储的直接查询存在显著延迟,严重制约了 Agentic 工作流的高效运转。


    本次演讲将聚焦如何通过 Alluxio 技术突破 Agentic Memory 的性能瓶颈,详解其作为超大规模数据湖加速层的核心机制。在不依赖专用硬件、不改变数据格式与存储架构的前提下,Alluxio 实现 Parquet 查询 1000 倍性能提升的技术路径,以及如何为 Agentic AI 应用提供亚毫秒级响应的底层支撑,助力构建高效、敏捷的 Agentic 系统。


    演讲提纲:

    1. Agentic AI 驱动型组织直接在云对象存储上存储和提供 Parquet 文件的普遍方式,以及给Agentic 应用所带来的挑战

    2. 应对挑战的常见解决办法

    3. 加速 Agentic Memory,实现 Parquet 查询 1000 倍性能提升,Alluxio系统架构及优化设计

    4. 低延迟存储方案的成本对比

    4. 未来工作展望


    听众收益:

    - 了解针对加速 Agentic Memory的Alluxio 架构和工作原理,并学习核心优化技术;

    - 了解针对 Agentic AI 的数据湖查询性能优化实践,掌握查询优化的方法并了解实际案例。

    嘉宾
    DA数智大会2025 · 深圳站
    傅正佳 博士
    Alluxio 首席架构师
    2025-07-26
    09:30 -12:05
    计算革新,数据效能新引擎(出品人:关涛Tony)
    2025-07-26
    09:30-10:15

    腾讯 BiFang——湖流一体技术原理和实践

    业务背景:随着数据量的增长和实时分析需求的增加,流计算与数据湖的结合成为趋势。BiFang 作为湖流一体存储引擎,旨在实现流批数据处理入口的统一,支持全增量数据查询和端到端数据实时可见。


    方案选型:Apache Pulsar 和 Apache Iceberg 在腾讯内部都已经大规模落地,经历了超大规模业务验证,适合作为湖流一体融合的基座


    落地挑战:融合消息队列和数据湖架构带来较大改造挑战,兼顾全流程事务和无延迟的数据湖查询


    收益成效:

    - 突破流计算与数据湖的技术边界,实现"一份数据"同时支持实时消费与离线分析;

    - 相比Lambda架构节省40%存储成本,降低70%运维复杂度;

    - 支持端到端数据亚秒级实时可见,优于行业主流方案的分钟/秒级延迟


    演讲提纲:

    一. 架构设计

    1. 核心流程

    2. 系统模块

    3. 技术优势

    二. 核心场景

    1. 消息队列增强

    2. 实时数据湖

    3. 多引擎支持


    听众收益:

    - 腾讯大数据湖流一体技术架构

    - 腾讯大数据湖流一体技术落地实践

    嘉宾
    DA数智大会2025 · 深圳站
    占绍雄
    腾讯 机器学习平台部 高级研发工程师
    2025-07-26
    10:25-11:10

    通用增量计算:新一代数据架构的核心引擎

    面对数据与AI的新兴应用对实时性、规模与效率的极致追求,传统数据架构的“不可能三角”愈发凸显。诸多企业在“能用”的表象下,正承受着高成本与复杂性带来的“隐痛”,架构的演进升级已迫在眉睫。


    针对传统架构在实时性、成本与复杂性上的核心瓶颈,增量计算与Lakehouse的融合方案应运而生,为企业数据及AI平台现代化提供坚实基础。告别传统全量处理的沉重负担,增量计算通过精准聚焦数据“变化”,从根本上提升现代数据架构的效率与实时性,是构建敏捷、高效数据平台的核心引擎。


    演讲提纲:

    1. AI浪潮下的数据架构:从“勉强支撑”到“敏捷驱动”

    2. 破局之道:增量计算与Lakehouse构建新一代数据架构

    3. 范式革命:拥抱增量计算 —— “只计算变化的部分”

    4. 通用增量计算 (GIC) - 统一流批,定义未来

    5. 实战落地:增量计算+实时湖仓构建小红书实验数仓生产新范式


    听众收益:

    1. 传统数据架构的“能用”的表象 vs “难用”的内核;

    2. 了解通用增量计算技术标准与技术实现;

    嘉宾
    DA数智大会2025 · 深圳站
    李睿博
    云器科技 技术合伙人
    2025-07-26
    11:20-12:05

    Flink On K8s在作业帮的落地实践

    作业帮实时计算平台目前主要采用On Yarn多集群模式,面临运维成本高的问题。本次演讲将分享Flink上云的探索与实践,包括容器化改造、工具链适配、稳定性优化,以及监控、日志、用户依赖和ConfigMap的优化。同时,将重点介绍Flink On Yarn任务平滑迁移至Flink On K8s的解决方案,涵盖Flink任务State跨版本迁移、数据准确性校验以降低业务感知、权限统一迁移等关键技术点。


    最后,展望未来发展方向,如弹性伸缩、资源优化等,借助Flink Kubernetes Operator进行实践,并探索在离线错峰调度的可能性。


    演讲提纲:

    1. 作业帮实时计算平台的现状和架构介绍

    2. Flink 上云探索和实践 (容器化改造、工具链适配、稳定性优化)

    3. Flink On Yarn 任务平滑迁移Flink On K8s的相关问题解决

    4. 未来展望(弹性伸缩、资源优化等)


    听众收益:

    - Flink On Yarn 平滑迁移 Flink On K8s的相关痛点和问题解决

    - Flink 云原生场景下,不同的落地实践方式

    嘉宾
    DA数智大会2025 · 深圳站
    刘泽强
    作业帮 大数据研发工程师
    2025-07-26
    09:30 -12:05
    AI 时代的数据存储架构(出品人:程力)
    2025-07-26
    09:30-10:15

    货拉拉大数据存储架构演进历程

    随着全球物流行业数字化进程加速,货拉拉的数据量和业务量也增长迅速,大数据也从原有的单一私有云架构逐渐向多云演进,同时伴随着使用场景复杂和技术多样性等巨大挑战。


    本分享以货拉拉大数据存储在实时、离线、向量三个方向的跨云生产实践经验为基础,系统的阐述货拉拉在混合云场景下,大数据存储架构的演进历程,包含如何以业务为驱动做技术选型,以及如何解决跨云调用的数据稳定性和效率保证。


    演讲提纲:

    1. 背景

    a. 货拉拉的背景

    b. 大数据存储的背景

    2. 离线

    a. 架构演进

    b. 周边生态工具建设

    3. 在线

    a. 稳定性保障体系建设

    b. 业务接入

    c. 高性能KV选型

    4. AI存储

    a. 架构演进

    5. 总结和未来规划


    听众收益:

    - 典型互联网的存储架构演进过程

    - 大数据存储体系混合云部署的关键难点和解决方法

    - 向量数据库的选型与实践

    嘉宾
    DA数智大会2025 · 深圳站
    闫蒙蒙
    货拉拉 大数据存储资深工程师
    2025-07-26
    10:25-11:10

    高性能分布式缓存Curvine——多云大数据AI加速利器

    Curvine是使用Rust语言构建的高性能分布式缓存,对比Java方案,不仅性能有明显提升,更大的收益在于资源消耗的降低。相同负载下,可降低进程本身90%左右内存资源消耗。在OPPO内部,Curvine已经在多云大数据领域,多个场景落地,稳定性和性能均有明显收益。为了业界共享Curvine带来的加速收益,同时也加快Curvine的发展,我们将该项目推出开源,我们一起迎接Rust重构基础设施的浪潮。


    演讲提纲:

    一、技术架构:

    1、分布式缓存基本架构

    2、Rust Based 高性能设计

    3、高可用架构

    4、FIO性能测试结果

    二、分布式缓存应用场景:

    1、大数据Shuffle加速

    2、多云数据缓存

    3、AI训练加速

    4、模型、镜像文件拉取加速

    5、多云数据缓存


    听众收益:

    - 了解基于Rust构建的高性能分布式缓存的架构设计,体验Rust语言带来的性能和成本收益冲击

    - 发掘大数据和AI场景下大规模数据IO的痛点解决方案

    嘉宾
    DA数智大会2025 · 深圳站
    付庆午
    OPPO 数据平台部大数据架构师
    2025-07-26
    11:20-12:05

    腾讯云高性能存储GooseFS成为AI存储新范式

    嘉宾
    DA数智大会2025 · 深圳站
    于飏
    腾讯云 数据湖存储团队 专家工程师
    2025-07-26
    09:30 -12:05
    大模型驱动的个性化推荐系统新范式(出品人:陈凯龙)
    2025-07-26
    09:30-10:15

    蓝心小V的问答后相关问题推荐实践 

    围绕提升蓝心小V用户体验,提升用户对话轮次,基于传统推荐链路,结合大模型建设内容生成,内容评估等能力;方案上结合SFT,DPO等大模型技术在业务落地。


    演讲提纲:

    1. 背景介绍:蓝心小V的相关推荐场景、现状、挑战

    2. 推荐方案:整体推荐链路介绍

    3. 大模型模块:结合大模型技术,优化推荐模块

    4. 总结与展望:结合用户在手机端相关场景,拓展推荐场景,提升用户体验


    听众收益:

    - 了解vivo在蓝心小V推荐场景的落地方案

    - 了解大模型在推荐场景中数据构建和训练流程

    嘉宾
    DA数智大会2025 · 深圳站
    梁天安
    vivo 人工智能部算法工程师
    2025-07-26
    10:25-11:10

    大模型增强的推荐系统研究与实践

    大语言模型能力逐渐增强,成本不断下降,推动推荐系统经历又一次技术的升级,本次演讲从大语言模型增强的推荐系统、生成式推荐技术和Agent中的个性化技术三个维度,介绍相关的研究和实践。


    演讲提纲:

    1. 推荐系统简介

    2. LLM增强的推荐系统

    3. 生成式推荐

    4. Agent中的个性化技术


    听众收益:

    - 了解生成式推荐

    - 了解LLM4REC

    嘉宾
    DA数智大会2025 · 深圳站
    尹铭佳
    中国科学技术大学 认知智能全国重点实验室 博士
    2025-07-26
    11:20-12:05

    QQ音乐AI助手个性化推荐优化实践 资源 2@4x.png1405460843617065.png

    将围绕如何通过结合大模型的相关技术展开演讲,包括后训练,工具调用,RAG等方式,优化QQ音乐AI助手个性化推荐功能优化,从而提升对话轮数,优化个性化推歌效果,提升QQ音乐的个性化推荐体验。


    演讲提纲:

    1- AI助手的个性化推荐现状简介

    2- AI助手个性化效果评测方案

    3- 数据采集以及后训练优化

    4- 结合大模型和传统个性化推荐

    5- 总结与展望


    听众收益:

    - 了解对话式个性化推荐的技术现状

    - 了解QQ音乐在个性化助手落地的实践经验

    - 了解大模型相关技术和个性化推荐的结合

    嘉宾
    DA数智大会2025 · 深圳站
    邹彬
    腾讯音乐 平台产品部高级工程师
    2025-07-26
    09:30 -12:05
    大模型驱动风控与安全(出品人:赖荣凤)
    2025-07-26
    09:30-10:15

    平安人寿智能风控体系建设实践 

    平安人寿坚持保险姓保构建新一代智慧核保平台,通过“打造行业一流的预核保平台、推出领先的核保政策、构建领跑行业的大数据风控模型”等核心工程,全面推动数字化转型,促进数据要素流通。真正让客户体验“科技,让投保更简单”!


    引入机器学习、联邦学习等先进技术,推动数据要素流通,搭建亿量数据集市,升级覆盖保前、保中、保后全生命周期的智能核保模型体系。通过联邦学习分布式训练方法,帮助保护客户数据隐私的同时,模型更加精准且稳定地识别客户风险,助力核保推出全国差异化核保政策,实现千人千面核保审核。


    演讲大纲:

    1. 寿险智能风控体系的发展及目标

    2. 数据互联在风控体系中的创新应用

    3. 大数据算法平台在风控体系中的创新应用

    4. 大模型在风控体系中的创新应用

    5. 业务应用价值和未来探索方向


    听众收益:

    - 了解平安人寿风控整体解决方案

    - 学习平安人寿智能风控体系的创新应用

    - 探讨大模型时代下金融风控的发展方向

    嘉宾
    DA数智大会2025 · 深圳站
    陈依云
    平安人寿 数据挖掘专家
    2025-07-26
    10:25-11:10

    大模型在数据安全领域的应用探索 

    随着AI平权的深入人心,将大模型应用到数据安全领域,是当前数据安全领域一个重要的研究方向。本次分享将从大模型在数据安全领域的应用现状、具体实践、应用挑战与可持续探索方向等方面展开介绍。


    演讲提纲:

    1- 业界如何将大模型应用到常见的数据安全技术场景上

    2- 具体场景如何落地大模型以及落地效果、遇到的挑战

    3- 可持续探索的方向,让大模型在数据安全领域发挥更大的价值


    听众收益:

    了解大模型在数据安全领域应用的前沿进展,包括应用现状、具体实践、应用挑战与可持续探索方向等方面,帮助听众了解大模型在数据安全领域的应用价值,以及具体如何开展大模型的在数据安全领域的应用。

    嘉宾
    DA数智大会2025 · 深圳站
    林伟壕
    微信 高级安全工程师
    2025-07-26
    11:20-12:05

    HyperGPU:机密计算释放通用GPU算力,构筑大模型密态算力底座

    数据已成为数字经济时代的核心生产要素。然而,数据在流通过程中面临着隐私泄露、数据篡改和未经授权访问等诸多安全挑战。可信执行环境(TEE)技术以相对更低的技术成本提供了这些问题的解决方案。然而在大模型时代下,对TEE的算力提出了更严峻的挑战。


    我们提出的 HyperGPU 方案,在原本 HyperEnclave 的通用 CPU TEE 基础之上继续拓展了对 GPU 的支持能力,可以让原本不具备硬件 TEE 能力的通用 GPU 设备接入 TEE 环境,为大模型场景的 TEE 产品提供更多算力支持,并且大幅降低设备替换成本。


    演讲提纲:

    1. 背景介绍:

      a. 数据要素市场需求

      b. 机密计算技术特点

      c. 大模型推理场景的隐私需求

    2. HyperGPU 设计

      a. HyperGPU 所针对的威胁模型

      b. 整体架构设计对控制面和数据面的保护

      c. 适用于通用设备的可信认证机制

    3. HyperGPU 实现和性能

      a. 实现代码成本

      b. 性能数据

    4. HyperGPU 未来规划:

      a. 通用性和安全增强

      b. 跨平台、跨云部署


    听众收益:

    - 了解 GPU TEE 目前的最新进展

    - 了解 TEE 技术在大模型场景下的安全能力

    嘉宾
    DA数智大会2025 · 深圳站
    徐基明 博士
    蚂蚁密算科技 基础设施技术专家
    2025-07-26
    14:00 -17:40
    金融场景GenAI创新应用(出品人:周纪海 博士)
    2025-07-26
    14:00-14:45

    证券知识库构建及应用

    嘉宾
    DA数智大会2025 · 深圳站
    毛瑞彬 博士
    深圳证券 数据中心负责人
    2025-07-26
    14:55-15:40

    从提示词到评估指标:构建银行场景下的大模型应用评价体系 1405460843617065.png

    随着银行内部对大语言模型(LLM)应用的持续深入,从邮件助手到合规审核、从营销文案生成到流程自动化,大模型已逐步嵌入业务流程核心。然而,如何科学评估大模型的能力、判断提示词的有效性,以及建立稳定、可复用的提示词迭代机制,成为制约大模型应用效果的关键瓶颈。本次分享将围绕大模型在银行业务场景中的评估体系展开。


    演讲提纲:

     1. 背景介绍

     2. 提示词与模型能力的评估

     3. 构建企业内部数据飞轮

     4. 实践效果与反思


    听众收益:

    - 了解大模型在银行业务场景中提示词工程与模型评估的关键难点

    - 掌握测试数据构建、指标设计、评估流程标准化的核心方法

    - 获取一套适用于金融场景的大模型评估与提示词优化的落地框架

    - 借鉴实际项目经验,避免常见陷阱,提升大模型应用效果与效率

    嘉宾
    DA数智大会2025 · 深圳站
    韩方巍
    汇丰科技 人工智能研发专家
    2025-07-26
    15:50-16:35

    AI 原生驱动 RBF 生态协作网络的认知重构与探索实践

    本次分享聚焦滴灌通集团在 AI 原生 RBF 生态协作网络构建过程的认知重构与探索实践:

    认知升级:推动三大思维转变 ——AI 从效率工具向新质生产力范式重构器升级;人机关系转向 "人 + AI" 共生进化;场景应用从单点突破迈向生态化发展。

    实践路径:构建自进化 RBF 智能化知识库,打造 AI 驱动行业研究社区;实现业务场景从 AI 赋能到多 Agent 协作决策全流程智能化;革新需求传递至产品共创的协作模式;通过部门智能体训练促进组织向智能体网络转型。

    方法框架:提出 "思维 - 场景 - 技术 - 组织" 四位一体的 AI 原生升级方法论,展望智能体协作网络驱动的商业新生态。


    演讲提纲:

    1、一个"极具挑战"的任务

    1.1老板的"疯狂"要求 - 构建AI原生的RBF生态协作网络

      -传统的"加人力"模式已死,AI原生是唯一出路

    1.2 RBF收入分成模式简介,RBF投融资领域的挑战


    2、认知重构 - AI思维的跃迁

    2.1 从工具思维到新质生产力范式

      -传统认知:AI是提效工具 VS 新认知:AI是范式重构器

    2.2 从替代人工到人机协作

      -人机关系的重新定义:不是"人 vs AI",而是"人+AI"的共生进化

    2.3 从场景应用到生态进化

      -选择合适场景突破,相信进化的力量


    3、RBF生态场景AI应用落地实践

    3.1 RBF知识库智能化 - 从知识管理到AI进化

      -构建RBF领域专用知识库,并可自我进化和迭代

    3.2 行业研究社区 - 从人力密集到AI密集

      -7×24小时的行业洞察和趋势分析内容生成

    3.3 业务场景AI化 - 从场景应用到协作网络

      -AI挂牌->AI评估->AI解读->多Agent协作决策

    3.4 协作范式重构 - 从需求传递到需求共创

      -业务写 BRD VS 业务生成具体产品原型

    3.5 组织智能化 - 从职能分工到智能体网络

      -组织创新:产品、研发、测试各自训练专属智能体

      -未来愿景:研发组织的自主进化和智能决策


    4、总结与展望

    4.1 AI原生升级思路

      -思维先行:建立AI原生的认知框架

      -场景切入:选择高频痛点作为突破口

      -技术务实:选用实用技术,边干边调整,相信进化的力量

      -组织重构:组织形态重构,协作范式重构,文化重构

    4.2 未来展望

      -以对AI原生协作网络贡献度来评价员工

      -每个行业或公司都有一张张智能体协作网络


    听众收益:

    - AI认知:理解人机共生与生态进化的AI 原生思维

    - 实践经验:掌握 RBF 生态智能化落地的具体方法。

    - 趋势把握:探讨AI 原生升级方向,预判智能体协作网络趋势。

    嘉宾
    DA数智大会2025 · 深圳站
    罗意
    滴灌通集团 高级技术副总裁 & 首席架构师
    2025-07-26
    16:45-17:30

    数智化下的财务变革:知识图谱与AI融合驱动下的财务新生态

    在数智化转型浪潮下,企业内部面临财务流程割裂、数据价值难挖掘等问题。通过引入知识图谱与AI融合方案,构建业财一体化智能财务平台,实现发票核验自动化率提升至90%,结算效率提高40%。落地过程中攻克了异构系统集成、非结构化数据处理等难题,创新采用图神经网络优化关联稽核逻辑,形成可复用的智能财务中台能力。


    演讲提纲:

    一、业务背景
    数智化转型趋势下,传统财务模式面临效率低、数据孤岛、风险滞后等痛点
    企业亟需构建一体化、智能化、可视化的新型财务管理体系

    二、方案选型
    技术融合路径 :知识图谱+AI(NLP、图神经网络、RPA)双轮驱动
    平台架构设计 :智能财务中台 + 业财知识图谱引擎
    核心功能模块 :智能核算、发票核验、关联交易稽核、风险预警

    三、落地挑战
    异构系统集成复杂度高,数据口径不统一
    非结构化数据处理难度大(如PDF发票、合同文本)
    财务规则逻辑抽象,难以转化为图谱关系模型
    用户习惯固化,对智能系统的接受度有限

    四、解决思路
    构建统一的财务语义层,打通ERP、OA、税务等系统数据
    利用NLP抽取关键字段,结合图神经网络挖掘关联风险
    设计"人机协同"流程,提升用户参与感与信任度
    建立持续优化机制,通过反馈闭环不断优化模型准确性

    五、解决成效(数据支撑)
    发票核验自动化率从60%提升至90%,人工干预大幅减少
    结算效率提升40%,月结周期缩短3天
    形成可复用的知识图谱资产,支持跨业务线快速部署

    六、未来规划
    推进财务决策智能化,实现预测性分析与自动建议
    打造财务大模型(Finance LLM),增强自然语言交互能力
    向供应链金融、合规审计等领域延伸应用边界

    七、总结
    知识图谱与AI融合正重塑财务价值链条,推动其从“事务性”向“战略性”转变
    技术只是起点,组织协同、流程重构与人才培养同样关键
    智能财务新生态已初现


    听众收益:

    - 掌握智能财务平台的核心构建路径
    - 了解如何选型技术方案并落地实施,包括系统架构、数据治理与模型设计
    - 学习如何将非结构化数据转化为可计算的财务知识资产
    - 获取真实业务场景中的落地经验与解决方案
    - 借鉴企业在异构系统集成、规则建模、人机协同等方面的成功实践
    - 理解关键挑战的应对策略与优化方法

    嘉宾
    DA数智大会2025 · 深圳站
    钱亮
    顺丰 后端开发高级工程师
    2025-07-26
    14:00 -17:30
    大模型助力产品研发(出品人:彭云鹏)
    2025-07-26
    14:00-14:45

    百度智能化研发落地实践

    随着大模型技术的蓬勃兴起,各行各业正以前所未有的热情拥抱人工智能的浪潮,智能编码作为落地最快和效果最佳的场景,受到了广泛的关注。在过去一年中,智能代码助手不断演进,研发工程师的智能编码需求也不断升级,关注重点从早期的补全,变成了预测改写以及代码智能体等。


    本次分享,我们将深入了解百度在智能研发领域的洞察、创新解决方案及丰富实践案例,并剖析背后的技术原理。 


    演讲提纲:

    1. 研发智能化的机遇与挑战 

    2. 百度研发智能化探索

    2.1 代码推荐准确率提升

    2.2 智能体建设

    2.3 多端复用

    3. 百度研发智能化落地实践

    3.1 DevOps全流程提效

    3.2 落地效果

    4. 思考与展望 


    听众收益:

    - 了解百度是如何从各个环节落地智能化研发并进行实际提效的 

    - 了解如何建立更懂企业的智能化研发工具链

    嘉宾
    DA数智大会2025 · 深圳站
    杨经纬
    百度 工程效能部前端研发经理
    2025-07-26
    14:55-15:40

    数据和AI融合研发效能提升实践——基于平台工程的群核科技研发效能IDP体系建设 

    数据驱动和AI应用融合的理念,为平台工程的提供了更强大的落地能力。基于大数据和AI融合技术的Intenal Developer Product(IDP)体系建设,为各种规模的软件开发团队的效能提升提供了一种高ROI的可行路径。


    本次分享将以群核科技的实践讲述一个效能提升循环闭环:首先通过IDP体系IT化、产品化研发交付流程各个环节,然后基于IDP通过数仓/数据湖方式获得和处理研发交付流程的各种颗粒度数据,再制定出符合各自团队的效能度量指标集合,通过量化数据指标发现问题,基于最先进的大语言模型等多模态大模型的能力,对需求分析、技术方案设计、编码、测试、Code Review,部署、发布等各个研发价值的交付环节提升效能;可以根据业务重点、最短板环节、最高ROI等选择来高ROI提升研发效能,并闭环体现在量化的效能度量指标上。


    同时会从软件和互联网公司通用的研发过程出发(从产品或业务需求分析开始,到正式软件交付给用户或客户),结合群核科技的真实场景,详细阐述如何设计和实现多个IDP产品,如何应用大数据和AI技术高ROI提升效能。


    演讲提纲:

    1. 常见研发效能提升方式的问题和难点

    2. 基于平台工程的数据驱动和AI应用理念

    3. 组织架构和产品、技术上的如何开展工作

    4. 研发流程梳理和关键指标定义

    5. 群核研发效能提升闭环实践:数据驱动和AI应用高ROI实践落地


    听众收益:

    - 对基于平台工程的数据驱动和AI应用理念,来提升研发效能方式的新的思路和认知;

    - 了解研发效能提升不仅仅是技术问题,更是产品(IDP)和组织结构设计的问题;

    - 通过群核科技的关键指标定义了解一种实际的研发效能指标集合定义;

    - 了解如何引入数仓等大数据技术数据驱动效能提升,同时结合最新的大模型技术如何在研发交付流程的关键环节提效;

    嘉宾
    DA数智大会2025 · 深圳站
    胡广寰 博士
    杭州群核科技(酷家乐)资深技术总监
    2025-07-26
    15:50-16:35

    解决 Coding Agent 知识积淀和盲写问题两大难题的方法与实践

    随着 GitHub Copilot、Cursor、Claude Code 等工具的日益普及,越来越多的代码开始由 AI 产生。2025 年 Vibe Coding 概念席卷全球,Coding Agent 的竞争已经从助手性质开始向全功能 Agent 进发,Coding Agent 的 Context Providing 问题最终被证明还是以用户的 Workspace 和 IDE 为基础打造是最好的,而另外两大问题还没有答案。本次演讲将同大家探讨这两大难题的挑战和可能路径。


    演讲提纲:

    一、有限上下文带来的问题

    - Context Providing:LLM 的私有信息只有上下文

    - 如何高效精准的给 LLM 提供上下文

    - 组织上下文和写代码的效率 PK

    二、Coding Agent 的表现取决于知识积淀

    - 知识的丰度和精度

    - RAG 是问答的好解决方案而非 Agent 的知识解决方案

    - FT 是否是好的内建知识的方式

    - Online Learning 有没有研究进展

    三、盲写搞不定复杂任务的高质量交付

    - 软件是复杂的

    - Coding-Testing 循环必须被建立起来

    - 多 Agent 协同

    四、Coding Agent 是人机交互的缩影

    - 未来的人机交互

    - 机器人要像人么

    - MCP VS CUA


    听众收益:

    - 通过了解 Coding Agent 本质和现状来理清当前 Agent 面临的问题

    - 解决搭建无人值守的 Coding Agent 的核心障碍

    嘉宾
    DA数智大会2025 · 深圳站
    王振威
    Gbox AI CTO
    2025-07-26
    16:45-17:30

    从数据到药物:多模态大模型在AI for Science中的高效实践

    嘉宾
    DA数智大会2025 · 深圳站
    李昱 博士
    IDEA 研究院主任研究员、AI4Science负责人
    2025-07-26
    14:00 -17:40
    Agentic AI 最佳实践(出品人:梁云鹏)
    2025-07-26
    14:00-14:45

    超越 RAG:迈向智能体时代的 Agentic RAG

    检索增强生成(RAG)通过结合外部知识检索和大语言模型,显著提升了生成内容的准确性和时效性。然而,传统的 RAG 系统受限于静态工作流,难以应对复杂多步骤推理和动态任务需求。基于RAG框架,我将介绍 Agent 框架的演进,剖析 Agent 如何通过自主决策与动态规划提升负责任务处理能力。再进一步,我们探索了集合 Agent 能力的高阶 RAG 范式——Agentic RAG,它通过引入自主智能体,将反思、规划、工具调用和多智能体协作等机制融入 RAG 流程,实现了检索策略的动态优化和上下文理解的迭代增强。


    本次演讲会介绍从 RAG 到 Agent 再到 Agentic RAG 过程中我们的探索和思考,并对未来 Agent 的发展方向做探讨。


    演讲提纲:

    1- RAG 的优势和局限性

    2- 从 RAG 到 Agent,LLM 高阶能力的体现

    3- Agentic RAG 探索

    4- 未来技术方向探讨


    听众收益点:

    - 了解 RAG,Agent 再到 Agentic RAG 的发展路径

    - 了解发展过程中所面对的挑战和一些方案

    - 探讨未来的技术发展趋势

    嘉宾
    DA数智大会2025 · 深圳站
    李晓鹏
    香港城市大学 博士
    2025-07-26
    14:55-15:40

    AI视频技术驱动跨境电商增长:VidAU.ai如何实现转化率提升40%与成本降低90%

    面对跨境电商内容制作成本高、效率低(传统拍摄成本达5万元/项目,周期长达数周)导致无法快速测试爆品的业务痛点,VidAU.ai采用自研AI视频生成框架提供一站式解决方案。在多语言适配、内容一致性等挑战下,通过AI批量生成、智能匹配优化算法和数据反馈强化机制,实现视频制作效率提升60%、成本大幅降低到原本的1/10。


    演讲提纲:

    一、背景痛点:
    跨境电商视频制作成本高、效率低、无法快速响应市场
    70%卖家因内容产出慢错失爆品机会

    二、方案选型:
    对比传统拍摄 vs. AI方案:传统需5人团队、高外因风险;AI仅需1人、1天准备(人工 Vs Agent工作流对比)
    选型依据:VidAU.ai 的 URL 转视频功能、多语言支持(50+语言)和相似爆款视频克隆技术

    三、落地挑战:
    技术挑战:脚本相似性、素材匹配算法、视频高效生成等
    协作挑战:跨团队整合(内容、运营、技术)
    资源挑战:冷启动数据不足(基于tiktok爆款视频数据库的垂类模型解决)

    四、关键突破:
    创新架构:VidAU.ai 的“爆款分析-模式提取-批量生成-数据迭代”四步工作流(批量生成流程)
    算法优化:脚本生成 + 智能标签系统,提升内容相关性(素材库搭建)
    流程革新:白棚拍摄+AI后期,实现“多Agent 高效协同”的新生产业务流程(工作流)

    五、成效验证:
    案例分享:客户案例1月销售额+250%,停留时间45秒→2分钟;客户案例2转化率2%→5.5%

    六、未来规划:
    技术演进:深化场景 Agent 能力与建立自动化工作流。
    生态扩展:深化 TikTok 的视频生成、广告投放、数据回收的业务闭环


    听众收益:

    - 掌握 TikTok 小店的2025年最新冷启动方法
    - 掌握高转化视频的制作框架与AI工具应用
    - 复制爆款增长模型:应用“爆款克隆+数据迭代”机制,提升 ROAS

    嘉宾
    DA数智大会2025 · 深圳站
    刘振华
    位道科技 CTO
    2025-07-26
    15:50-16:35

    Agent 应用实现新一代家居设计制造数字化转型

    在数字化浪潮席卷全球的今天,家居行业正经历从传统制造向智能服务的深刻变革。本次演讲将聚焦AI Agent技术如何成为家居产业升级的核心驱动力。


    演讲从行业痛点切入,剖析消费者对个性化、高效服务的需求与传统设计制造低效之间的矛盾,提出以“AI+垂类大模型”为核心的技术解决方案。通过三维家研发的矢量数据集、整家AI大脑及第三代AI+3D助销工具等案例,详解AI如何实现“3步出全屋方案”“设计即生产”的高效闭环,推动C2M智能制造模式落地。同时,探讨AI与设计师的协同进化——释放设计师创意潜能,使其从繁琐绘图转向方案策划与用户服务,并借助VR/AR、自然语言交互等技术打造沉浸式体验,缩短用户决策链路。


    演讲还将直面技术挑战,提出通过BIM数智化与自主学习算法优化复杂场景适配,并展望AI驱动下的全球化定制与产业生态重构。听众将深度理解AI在家居全链路的应用逻辑,获取降本增效的实践路径,并洞察未来技术趋势,为企业在数字化转型中抢占先机提供战略参考。


    演讲提纲:

    一、家居行业的数字化转型趋势与挑战

    1. 消费需求升级与市场竞争白热化

    - 传统痛点:设计周期长、前后端协同低效、设计师资源稀缺、生产与交付脱节

    2. AI驱动的变革机遇

    - AI技术从辅助工具到核心引擎的转变,重塑家居设计、生产、服务全链路


    二、AI技术在家居设计中的革新应用

    1. 技术核心:矢量数据集与AI大模型

    - 矢量数据:通过坐标精准表达空间布局与产品属性,确保设计可落地生产

    - 垂类大模型:室内空间大模型、定制家居大模型,结合超200亿参数的家装数据,实现全屋智能布局

    2. AI设计工具的革命性突破

    - “3D秀”工具:移动端AI出图神器,3步生成全屋整装方案,降低设计门槛

    - AI灵感生成:基于多模态数据,提供差异化创意方案

    3. 沉浸式体验与精准交互

    - VR/AR技术结合AI,实现虚拟漫游与实时调整,缩短用户决策周期


    三、制造端的数字化转型:C2M与全链路协同

    1. C2M智能制造模式

    - 从设计到生产的无缝对接:3D效果图直接生成生产指令,减少人工拆单误差,缩短交付周期

    2. 前后端一体化系统

    - 数字供应链:整合100万+商品模型,实现“模型即商品,所见即所得”

    - 柔性生产调度:AI算法优化生产计划,生产周期缩短32%,客单值提升2.5倍


    四、AI技术落地的挑战与应对策略

    1. 技术局限性

    - 复杂场景适配难题:多空间整体布局与个性化需求难以兼顾

    - 解决方案:增强AI自主学习能力,结合BIM技术实现全屋模拟

    2. 用户需求深度理解

    - 从“文生图”到“文生房”:通过自然语言交互与动态需求捕捉,实现“所想即所见”


    五、未来展望:AI驱动的家居产业新生态

    1. 技术趋势

    - 大模型深化应用:AI自主优化设计方案,动态响应用户需求与环境变化

    - 个性化定制普惠化:AI+跨境电商,推动家居设计全球化与本地化融合

    2. 行业价值重构

    - 设计师角色进化:从绘图工具到方案策划者,聚焦创意与用户服务

    - 企业竞争力升级:通过AI工具降低运营成本,提升客单值与品牌溢价


    六、案例分享:三维家的AI实践与成果

    1. 整家AI解决方案

    - 与华为全屋智能合作,实现灯光、设备一键布局,设计复用率提升90%

    2. 第三代AI Agent+3D场景助销工具梦想家

    - 支持AI画图、毛坯翻新,消费者DIY,助力企业服务消费者需求提升,用户体验提升,订单翻倍


    听众收益:

    - 技术洞察:了解AI在家居设计制造中的核心技术(矢量数据、垂类大模型、C2M模式)及其落地路径

    - 效率提升:学习如何通过AI工具缩短设计周期、降低人力成本、提升交付效率

    - 案例借鉴:获取三维家等头部企业的成功实践经验,包括整家定制、跨境电商等场景

    - 战略方向:明确AI技术如何赋能企业从“传统制造”向“智能服务”转型,抢占市场先机

    - 未来布局:洞察AI与家居产业融合的未来趋势,提前规划技术投入与生态合作

    嘉宾
    DA数智大会2025 · 深圳站
    曹健
    三维家 首席产品官
    2025-07-26
    16:45-17:30

    MoonAgent:为 Moonbit 编程语言定制的 Code Agent

    MoonAgent 是专门为 MoonBit 语言而开发一款 Code Agent,尽管如此,它也能用于开发其他编程语言,以及将其他编程语言的一些库或者工具翻译成 MoonBit。


    MoonAgent 的诞生可以快速的帮助 Moonbit 语言构建生态以及帮助程序员快速的学习和使用 MoonBit 语言。


    我们会分享一些我们在开发中积累的一些经验和技巧,包括通用的Code Agent 设计与开发, 以及如何让 MoonAgent 高效的利用 MoonBit 工具链,满足 MoonBit 的高性能需求,同时如何反向影响 MoonBit 语言的一些所设计,包括语法设计如何让大模型更好的理解,工具链的设计和使用方式如何提升大模型的使用成功率。


    演讲提纲:

    1. MoonBit 语言介绍

    2. 为什么我们需要开发自己的 Code Agent

    3. 通用 Code Agent 的开发与设计

    4. MoonAgent 的使用简介和关键特性


    听众收益:

    1. 了解高效易用的后起之秀编程语言:MoonBit

    2. 快速利用 MoonAgent 完成 MoonBit 语言的开发

    3. MoonAgent 和 通用 CodeAgent 的区别以及 编程语言如何和 Code Agent 更好的协作

    嘉宾
    DA数智大会2025 · 深圳站
    祝海林
    IDEA研究院基础软件中心 AI辅助编程专家
    2025-07-26
    14:00 -17:40
    大模型驱动的运营与营销升级(出品人:赵田)
    2025-07-26
    14:00-14:45

    LLM在微信实验系统中的应用 1408007663617065.png

    随着大语言模型(LLM)的爆发式发展,我们也尝试将LLM应用到实验领域的业务场景当中去。目前我们主要在基于LLM的智能Agent方向做了一些初步的尝试,希望在LLM的帮助下,能够将实验中的数据分析和一些基本操作通过智能Agent来自动执行,减轻用户的心智负担。


    演讲提纲:

    1. 实验场景的一些用户痛点

    2. 实验智能Agent的落地方案

    3. 案例分享

    4. 总结和展望


    听众收益:

    1. 了解实验场景中的用户痛点和提效方式

    2. 了解基于LLM的智能Agent的基本概念,以及通用LLM在垂直领域的落地方案

    嘉宾
    DA数智大会2025 · 深圳站
    熊涛
    腾讯微信 后台开发工程师
    2025-07-26
    14:55-15:40

    AI智能体在顺丰运营环节的应用

    AI 智能体在顺丰落地,核心要解决的问题之一,是如何适配顺丰专业物流场景的各种问题。然而,不同于一些文本办公类的通用场景需求,专业场景的应用有专业性、协作性、责任性、安全性的要求。只有建立适配顺丰业务运营场景的垂域智能体,才能满足顺丰业务的需求。 智能体服务需要有know-how的解决能力。


    我们基于智能体落地场景的复杂程度,划分为初、中、高阶:
1)初阶场景:让人工感知简单智能体能力,如实现知识问答的能力
2)中阶场景:让智能体理解并解决单个复杂问题

    3)高阶场景:如果保障安全、协作、效果的高阶要求,建立领域的模型。建立垂域的能力


    顺丰科技的营销营运智能体矩阵,聚焦在解决中阶、高阶的需求,以自研模型为和大模型为基础,以智能体开发工具为支撑,灵活快速搭建符合顺丰业务领域场景需求的智能体应用。提供用户面向客群营销,网络规划、运力资源等核心场景的智能决策能力。


    演讲提纲:

    1. AI 智能体技术简述

    2. 顺丰营销、营运决策场景、痛点问题

    3. 顺丰营销、营运智能决策方案的技术演进

    4. 顺丰科技智能体解决方案设计、建设

    5. 顺丰科技智能体解决方案应用、实践

    6. 未来展望


    听众收益:

    - 了解AI智能体技术在落地过程中需要考虑的因素,面临的挑战

    - 了解AI智能体在顺丰营销、营运场景的应用实践

    嘉宾
    DA数智大会2025 · 深圳站
    刘子恒
    顺丰科技 规划与资源决策算法总监
    2025-07-26
    15:50-16:35

    无人化监控大规模交易市场:实时大数据+ AI Agent在业务指标自动监控与自动归因分析中的实践 

    Grab 有大量的业务数据和指标需要检测和分析(非工程或系统指标)。传统的监控方法需要大量运营人工成本和需要克服困难的阈值建立和调整过程。传统的机器学习模型需要大量的算法工程师参与在外部数据采集,特征工程,非通用场景模型调优等工作。


    我们在尝试搭建新的架构来衔接大数据(包括实时和非实时)和AI Agent的获取、分析、推理能力的实践中,获得了许多心得体会,并且在近期上线到生产环境,得到了可观的效率和扩展性的提升。


    演讲提纲:

    1.  Grab 的业务指标在监控自动化和归因分析自动化场景中的需求

    2.  大数据对于 AI Agent 在监控和分析使用场景中的方案选型

    3.  AI Agent 对于不同业务指标的“归因分析”的挑战和应对

    4.  扩展性挑战和迭代

    5.  目前成果和下一步


    听众收益:

    - 了解大数据在接入AI Agent 模型的过程中遇到的挑战和解决思路

    - 了解AI Agent 在业务指标分析的场景中遇到的挑战和解决思路

    嘉宾
    DA数智大会2025 · 深圳站
    王冠峰 博士
    Grab Head of Engineering
    2025-07-26
    14:00 -17:40
    大模型增强用户体验与客户服务(出品人:马国俊)
    2025-07-26
    14:00-14:45

    平安人寿的AI赋能数字化运营实践

    数字经济时代,数字技术是新质生产力的关键支撑。传统金融业要加快数字技术创新及应用,赋能行业转型升级、提质增效,更好满足人民群众日益增长的金融服务需求。平安人寿积极探索全面数字化战略,大力推动数字化运营支持公司高质量转型。通过“机器+人”模式重塑运营流程,提升消费者服务体验,赋能队伍高质转型。


    在提升消费者体验方面,公司推出全AI理赔服务,实现“1句话 语音报案、1键上传材料、1分钟审核给付”,最快一笔赔付仅用时10秒;建立新契约品质智能风控体系,实现风险保单100%自动拦截;打造“金管家”数字门店,支持消费者全面自助,其中99%保全线上处理完成,件均不超3分钟。


    在赋能队伍高质转型方面,升级代理人AskBob智能助手,提供超2.9亿次精准解答咨询,提升队伍业务水平;打造智能陪练平台,支持代理人智能对练586万次,强化队伍专业技能。


    数字化运营已然成为寿险转型再腾飞的基石性工作,希望通过分享优秀经验,相互学习,共同推动行业高质量发展。


    演讲大纲:

    1. 为什么需要数字化运营

    2. 平安人寿数字化运营总体战略

    3. 在数字化赋能客户服务方面的创新实践

    - 首创全AI“111”极速赔服务

    - 建设新七月品质智能风控体系

    - 打造“金管家”数字门店

    4. 在数字化赋能销售展业方面的创新实践

    - 代理人智能销售助手

    - One平安线上体验中心

    - 智能会客厅

    - AI赋能代理人IP打造

    5. 平安人寿数字化运营总体成效

    6. 平安人寿数智化展望


    听众收益:

    - 认知升级:掌握保险行业AI落地的有效实践

    - 经验借鉴:学习复杂系统分阶段实施方法论

    - 技术视野:了解保险科技前沿趋势

    嘉宾
    DA数智大会2025 · 深圳站
    莫洋
    平安人寿科技研发部 AI产品负责人
    2025-07-26
    14:55-15:40

    大模型产品运营之路

    2025年初Deepseek爆火,大众突然对AI产生了浓厚兴趣,在顺丰业务场景中亦是如此。顺丰丰语大模型陆续推出了15+AI产品,涵盖基座大模型与多款AI应用,面向B/C客户、营运、国际物流、供应链、智慧办公等业务,通过有效的产品运营方式助力业务深度使用AI产品,实现降本增效增收的核心目标。


    演讲提纲:

    1. 大模型行业趋势与产品应用
    2. 顺丰科技AI产品全景
    3. 大模型产品运营实战案例分享
    4. 大模产品运营方法论
    5. 大模型产品未来规划


    听众收益:

    - AI与业务场景深度结合实例
    - AI在业务应用中的痛点与解法
    - AI产品运营方法论

    嘉宾
    DA数智大会2025 · 深圳站
    卢馨婷
    顺丰科技 大模型高级产品运营经理
    2025-07-26
    15:50-16:35

    开天情感陪伴大模型研发及应用实践 1408007663617065.png

    随着AI社交需求爆发式增长,用户对个性化交互、高浓度情感陪伴、多模态实时理解及隐私安全的诉求愈发凸显。然而,通用大模型在垂直社交场景中存在适应性不足、情绪价值弱、多模态融合低效与合规风险等短板,亟需构建自主可控的社交专属大模型。


    为此,我们提出以“场景专属、安全可信、多模态协同”为目标的自研开天社交大模型,其核心技术路径包括:

    技术创新:探索出了垂域大模型的研发思路,形成了CPT+SFT+RLHF迭代技术,过程中采用mask机制和动态样本调整方法提升模型学习的效率和质量;


    数据与训练优化:通过脱敏社交数据与两阶段训练(通用预训练+垂直微调),结合LoRA轻量化技术,实现高精度与低成本平衡;


    模型评测及推理:联合国内高校构建社交领域大模型评测方法和数据集,准确衡量垂域模型效果,同时通过模型剪枝量化等方式,加速线上推理,提升并发。


    目前,开天模型已在多个业务场景落地(TT语音soulmate板块),依据场景复杂程度,开天提供了7b,14b,32b等不同参数级别模型,既能满足用户情感陪伴诉求,又能平衡并发和推理延时。


    展望未来,开天模型将持续拓展高拟真人社交、心理健康支持、有温度智能客服等场景,并结合生成内容的全链路审核平台,确保合规可控。通过技术迭代与生态共建,开天致力为用户提供情绪价值,缓解用户焦虑和情感烦恼,推动社交生态向更温暖、更健康的方向演进。


    演讲提纲:

    1- AI 社交领域的用户诉求与场景

    2- 自研开天社交大模型的必要性及规划

    3- 开天社交大模型的研发之路

    4- 应用拓展与未来展望

    5- 总结


    听众收益:

    - 垂域模型从用户诉求到技术抽象的逻辑推导和规划过程;

    - 如何研发垂域大模型,从数据,模型,评测到推理的全流程解析;

    - 垂域大模型的应用前景和未来拓展;

    嘉宾
    DA数智大会2025 · 深圳站
    马金龙
    趣丸科技 媒体算法负责人
    2025-07-26
    16:45-17:30

    大模型助力抖音用户体验智能化

    围绕提升抖音用户体验,基于大模型建设体验信号识别、内容理解、原因诊断能力,方案上结合SFT、DPO、RAG等大模型技术在业务落地。


    演讲提纲:

    1. 背景介绍:抖音用户体验背景、现状、挑战

    2. 体验信号识别:扩充视频、评论等渠道感知体验问题

    3. 体验信号理解:建立摘要、质量分、语义观点看清体验问题

    4. 体验根因分析:结合大模型能力诊断问题背后的原因

    5. 总结与展望:当期应用的情况,后续会怎么迭代


    听众收益:

    - 了解抖音用户体验算法落地方案

    - 了解大模型在体验域有效的数据构建和训练流程

    嘉宾
    DA数智大会2025 · 深圳站
    蔡聪怀
    字节跳动 算法专家

    智领物流变革:基于丰语与丰知大模型的供应链智能决策实践 

    DA数智大会2025 · 深圳站
    唐恺
    顺丰科技 CMO

    唐恺,顺丰科技CMO;顺如丰来CEO,2019年加入顺丰。负责科技产品市场化工作,从0到1搭建科技产品商业化体系,基于顺丰优势数据服务和供应链建设经验,通过科技产品标准化、平台化搭建科技产品和解决方案能力,建立数字生态体系,提升科技驱动的行业解决方案服务能力,旨在为行业客户提供(融合物流科技产品及硬件设施、科技解决方案)的一站式、数智化行业解决方案和智慧供应链服务,提升其全供应链产业的数字化水平,以科技能力驱动商业模式变革。

    LLM Agent 开发新范式——自然语言的解析与执行

    DA数智大会2025 · 深圳站
    邓明轩
    亚马逊云科技 首席人工智能专家

    现任亚马逊云科技大中华区首席人工智能专家,主要负责大中华区架构师团队的技术建设工作,包括前沿技术探索,技术路线设定,架构师技术发展、职业发展等相关工作。

    邓明轩拥有25年IT从业经验。在加入亚马逊之前先后任职于IBM,BlackBerry,Apple等大型企业,从一线开发工程师起步,曾担任售后工程师,售前工程师,软件架构师等不同职位,覆盖大中华区各主流行业。他喜欢新技术,喜欢技术挑战,擅长于新型技术堆栈快速上手,勇于带领团队突入新领域。

    构建AI时代的大数据基础设施 

    DA数智大会2025 · 深圳站
    张治国
    阿里云 智能计算平台事业部 MaxCompute负责人

    赋能 AI与AI 赋能的多云统一数据平台

    DA数智大会2025 · 深圳站
    刘向阳 院士
    美的集团 首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow

    美的集团首席信息安全官兼软件工程院院长,欧洲科学院院士,IEEE Fellow IET Fellow ACM Distinguished Scientist。

    Big AI Data时代下,小红书数据架构的演进

    DA数智大会2025 · 深圳站
    吴浩亮 (马尔科)
    小红书 交易、基础数仓负责人

    有多年数据架构经验,擅长离线、实时数仓、OLAP 技术和数据湖技术在多场景的实践落地。

    DA数智大会2025 · 深圳站
    关涛
    云器科技 联合创始人&CTO

    云器科技联合创始人兼 CTO,曾任阿里巴巴 P10 研究员,主导了阿里云飞天大数据平台二代研发及落地,曾于微软云计算和企业事业部工作近十年,浙江省科技进步一等奖获得者。

    DataLab:一站式数据科学智能体的构思与挑战 1408007663617065.png资源 5@4x.png

    DA数智大会2025 · 深圳站
    侯忱
    腾讯大数据 算法研发工程师

    侯忱,腾讯大数据算法研发工程师,2020-2023年在腾讯大数据开展隐私计算研发工作,曾获2020年iDash冠军。2023年至今,作为核心成员参与腾讯大数据的智能数据分析与交互式数据开发能力建设,搭建数据领域Agent开发服务平台。DataLab 论文(ICDE 2025 Industry Track)作者之一。


    Data Agent智能决策引擎:数势科技在NL2Semantics与Multi-Agent架构上的革新与业务实践

    DA数智大会2025 · 深圳站
    韩秀锋
    数势科技 CTO

    13年+百度产品和研发管理经验,原百度地图场景化业务总经理,具备出色的产品、技术团队管理能力和技术实操经验。

    构建基于大模型和Agent的自动数据分析平台实践

    DA数智大会2025 · 深圳站
    陈嘉 博士
    Grab Head of Data Science, Integrity and Core Experience

    现任职东南亚领先的平台公司Grab,领导风控、安全、用户体验、智能客服等业务的机器学习算法团队,负责构建人工智能模型和解决方案,并致⼒于推动公司的⼈⼯智能战略落地。


    陈嘉在人工智能领域拥有超过15年的研发与管理经验,曾在联想担任机器智能实验室主任,并作为早期成员加入华为诺亚方舟实验室。此外,他还曾参与创立两家AI创业公司。陈嘉持有计算机科学博士学位,拥有超过10项专利,并在顶级会议期刊发表15篇学术论文,多次推动与高校与政府项目合作。

    Ofnil:Agent和智能图平台在游戏行业应用实践 1405460843617065.png

    DA数智大会2025 · 深圳站
    ​李力
    启思码 资深算法专家

    资深算法工程师,负责 OFNIL-GI 平台及解决方案建设,帮助出海客户共创商业化增长解决方案,提升ARPPU 40%+,留存提升 70%+。


    曾任腾讯商业化增长方向高级应用研究员,专注游戏社交推荐与算法研发,曾支撑30+游戏场景。主导或参与腾讯 10+ 游戏的商业化模块及社交模块开发及优化,均有显著提升。


    曾在微信视频号推荐团队,参与视频号推荐算法业务,负责召回算法及特征模块开发。

    芝麻企业助手中的Deep Research应用实践 

    DA数智大会2025 · 深圳站
    马宇翔
    蚂蚁集团企业信用部算法负责人

    运用 Elasticsearch 进行向量搜索及创建 RAG 应用

    DA数智大会2025 · 深圳站
    刘晓国
    Elastic 首席布道师

    中国社区首席布道师。新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过电脑设计,汽车电子,计算机操作系统,通信,云实时事件处理等。从爱立信开始,诺基亚,Ubuntu 到现在的 Elastic,从事社区工作有将近 20 年的经历。喜欢分享自己所学到的知识。坚信帮助别人就是帮助自己。希望和大家一起分享及学习。欢迎大家来参阅 Elastic 官方中文博客 elasticstack.blog.csdn.net

    RAG 技术全景:实时检索与可控生成的前沿实践

    DA数智大会2025 · 深圳站
    卢玥 博士
    顺丰科技 高级算法工程师,浙江大学LLM方向博士后

    卢玥博士(Dr. Yue Lu),拥有加州大学河滨分校计算机科学博士学位,曾在 SIGKDD、ICDM、DMKD 等国际顶级会议与期刊上发表学术论文 7 篇。她的代表作《Matrix Profile XXIX: C22MP, Fusing catch 22 and the Matrix Profile to Produce an Efficient and Interpretable Anomaly Detector》荣获 ICDM 2023 年度最佳论文亚军。卢玥博士曾与 Amazon、Google、Apple 等科技巨头深度合作,推动时间序列异常检测技术的产业化应用。


    目前,卢玥作为浙江大学与顺丰科技联合培养的 LLM 方向博士后,全面负责网络安全与数据安全业务的前沿技术研究与解决方案设计。她致力于将检索增强生成(RAG)等最前沿技术应用于威胁情报自动化、疑难告警精准定位及海量日志智能审计,助力构建兼具高效性与可解释性的安全大模型平台。

    从“字”到“画”:基于Elasticsearch Serverless 的多模态商品搜索实践 

    DA数智大会2025 · 深圳站
    刘松
    阿里云 搜索技术专家

    Data+AI在金融业数据治理体系升级实践 资源 1@4x.png

    DA数智大会2025 · 深圳站
    许璐
    平安财产保险 数据智能部架构师

    2015年加入平安,目前负责平安产险大数据基础平台研发管理优化等工作。

    AI 时代阿里云大数据技术演进与发展

    DA数智大会2025 · 深圳站
    赵弘扬
    阿里云 高级产品专家

    Pinterest在大语言模型数据处理上的最后一公里技术实践

    DA数智大会2025 · 深圳站
    罗震霄 博士
    Pinterest Sr. Staff Software Engineer

    罗震霄在Pinterest担任Sr. Staff Software Engineer,负责大数据实时处理引擎,监控平台,和大模型数据预处理。在加入Pinterest之前,罗震霄先后在 Cloudera,Uber,Twitter,Facebook 负责大数据引擎和机器学习平台的研发和运营工作。罗震霄是开源项目 Presto committer,Presto Technical Steering Committee member。本科毕业于复旦大学,博士(on leave)毕业于 University of Wisconsin Madison。

    AI 浪潮下的数据开发变革:Grab 的 Data Mesh 落地与数据开发自动化 1405460843617065.png

    DA数智大会2025 · 深圳站
    成峰
    Grab 数据基础设施平台负责人

    专注于大数据基础设施和平台开发,拥有多年在数据工程和技术管理领域的经验。在 Grab 工作期间,我负责开发旨在简化数据湖使用的工具,并推动公司 Data Mesh 的落地。 这种架构强调自助服务平台设计,专注于数据访问的民主化,并通过自动化智能决策实现大规模的业务洞察。


    有幸带领团队完成了一些关键项目,为 Grab 的数据平台构建关键基础设施,包括 Kafka 基础设施、MIDAS(指标平台)、自动化数据迁移和集成平台、元数据湖治理套件以及各种计算引擎(Spark,Trino,StarRocks,Pinot)、 数据智能BI工具等。

    阿里国际多模态大模型数据质量评估与合成技术探索 1408007663617065.png

    DA数智大会2025 · 深圳站
    赵健杉
    阿里国际 AI Business多模态数据负责人

    阿里国际AI Business多模态数据负责人,负责多模态大模型数据研发、数据标注、数据合成以及评估等工作。

    智能文档时代:多模态大模型驱动的数据处理与治理革新

    DA数智大会2025 · 深圳站
    刘超
    矩阵起源 AI平台研发负责人

    从业务价值视角有效构建高质量数据的方法和实践

    DA数智大会2025 · 深圳站
    易龙
    vivo 互联网 大数据专家

    现任vivo互联网大数据专家,拥有10年实践经验,专注于多模态数据技术相关的研发工作,对于海量数据场景下关于数据全链路稳定性保障、数据质量提升、数据成本优化等整体方案设计和落地有丰富经验,擅长从业务价值视角出发,提供有效的数智化解决方案。

    AI4Data 在大模型数据生产中的应用与实践 

    DA数智大会2025 · 深圳站
    蒋乾
    上海 AI Lab 大模型数据研发专家

    负责大模型预训练数据生产,设计和落地 Data + AI 系统架构。

    小米基于 Gravitino 在 Data / AI 数据管理和处理中的实践 1405460843617065.png

    DA数智大会2025 · 深圳站
    肖杰宝
    小米 软件研发工程师

    肖杰宝,小米公司软件研发工程师,Apache Gravitino Committer。目前主要负责数据湖 Iceberg 和元数据湖 Gravitino 等相关研发工作。

    StarRocks 在滴滴的湖仓一体化实践 1405460843617065.png

    DA数智大会2025 · 深圳站
    林雨
    滴滴 资深大数据研发工程师

    多年互联网从业经验,从事大数据 OLAP 方向研发5年以上,熟悉 Druid/Presto/ClickHouse/StarRocks 等大数据引擎,为 ClickHouse 社区和StarRocks 社区提交多个 PR,目前致力于将滴滴大数据 OLAP 引擎统一到 StarRocks 而努力。

    微信大数据作业规模化上云的优化实践 1405460843617065.png

    DA数智大会2025 · 深圳站
    吴乾豪
    腾讯 微信事业群技术架构部高级工程师

    硕士毕业于华南理工大学,在 DevOps、大数据、AI云原生领域有超过9年的工作经验,对 Kubernetes 及其开源组件改造、架构调优、周边生态建设等有丰富的经验。目前就职于微信技术架构部,负责大数据、AI on Kubernetes 的相关基础建设,从0-1支持了微信相关业务云原生大规模落地,实现了全面上云。

    AI 驱动下的数据系统演进:从存储为中心到多模融合的技术实践

    DA数智大会2025 · 深圳站
    姚维
    PingCAP TiDB 中国区研发负责人

    曾在奇虎 360 基础架构组负责开源 MySQL 中间件 Atlas,2012 年创业做过安卓推送系统聚能推。加入 PingCAP 后曾带领 TiDB SQL Infra 组,TiKV 事务组,PD 组等技术团队。2020-2024 年负责 PingCAP 全球开源社区业务,现在负责 PingCAP 中国研发团队。

    顺丰Agent平台企业落地之道

    DA数智大会2025 · 深圳站
    宋晨川
    顺丰科技 后端开发高级工程师

    负责顺丰AI平台技术管理以及架构。2018年加入顺丰,从0到1搭建顺丰内部AI平台,解决企业内部AI资源获取以及使用问题,提升资源使用效率;提供工具实现智能业务快速落地,提速创新。大模型时代基于AI平台转向大模型平台,搭建内部Agent平台,模型广场等大模型工具,帮助企业内部快速落地Agent应用。

    跨越鸿沟,Agentic AI产业落地方法与实践

    DA数智大会2025 · 深圳站
    刘永峰
    云启星辰 联合创始人&CTO

    曾就职于腾讯,2017年作为联合创始人创立云启星辰,专注于AI技术在产业的深度应用与落地,拥有丰富的行业和技术的双重经验。

    加速 Agentic Memory:在 PB 级数据湖上实现 Parquet 查询 1000 倍性能提升

    DA数智大会2025 · 深圳站
    傅正佳 博士
    Alluxio 首席架构师

    本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。

    腾讯 BiFang——湖流一体技术原理和实践

    DA数智大会2025 · 深圳站
    占绍雄
    腾讯 机器学习平台部 高级研发工程师

    腾讯机器学习平台部-计算中心高级工程师,主要负责 BiFang 实时湖流一体存储引擎的架构设计和研发工作,推动湖流一体在腾讯内部的业务落地。曾在腾讯和字节跳动负责数据湖和流批一体服务的研发工作。

    通用增量计算:新一代数据架构的核心引擎

    DA数智大会2025 · 深圳站
    李睿博
    云器科技 技术合伙人

    云器科技技术合伙人,中国通信学会开源技术委员会委员,致力于分布式系统、大数据平台相关研发工作十余年,曾任阿里云资深技术专家,主导 MaxCompute 湖仓一体研发等工作。2023 年加入云器科技,负责推进公司产品 Lakehouse 的生态构建,Studio 实时化升级等研发工作。

    Flink On K8s在作业帮的落地实践

    DA数智大会2025 · 深圳站
    刘泽强
    作业帮 大数据研发工程师

    在作业帮主要负责实时计算平台的研发、Flink引擎的开发维护,以及 StarRocks OLAP引擎。

    货拉拉大数据存储架构演进历程

    DA数智大会2025 · 深圳站
    闫蒙蒙
    货拉拉 大数据存储资深工程师

    拥有多年大数据存储研发经验,主要负责货拉拉 HBase、大数据离线存储、向量存储的研发和维护,同时是开源 Apache HBase contributor。

    高性能分布式缓存Curvine——多云大数据AI加速利器

    DA数智大会2025 · 深圳站
    付庆午
    OPPO 数据平台部大数据架构师

    目前在OPPO数据架构组负责架构演进研发;Spark 开源RSS项目Shuttle发起人;Curvine高性能分布式缓存开源项目发起人;曾供职去哪儿网大数据,阿里云MC团队。

    腾讯云高性能存储GooseFS成为AI存储新范式

    DA数智大会2025 · 深圳站
    于飏
    腾讯云 数据湖存储团队 专家工程师

    蓝心小V的问答后相关问题推荐实践 

    DA数智大会2025 · 深圳站
    梁天安
    vivo 人工智能部算法工程师

    硕士毕业于华中科技大学,从事推荐算法工作多年,目前负责vivo蓝心小V推荐场景算法优化。

    大模型增强的推荐系统研究与实践

    DA数智大会2025 · 深圳站
    尹铭佳
    中国科学技术大学 认知智能全国重点实验室 博士

    尹铭佳来自中国科学技术大学,是认知智能国家重点实验室和安徽省大数据分析与应用重点实验室的博士。主要研究兴趣聚焦于个性化推荐系统、用户复杂行为建模,和以数据为中心的人工智能等重点领域,曾在TOIS、KDD、ICML等国际高水平学术期刊会议上发表高质量论文多篇,并获得了数据挖掘领域顶级会议KDD2024唯一最佳学生论文奖。

    QQ音乐AI助手个性化推荐优化实践 资源 2@4x.png1405460843617065.png

    DA数智大会2025 · 深圳站
    邹彬
    腾讯音乐 平台产品部高级工程师

    毕业于华南理工大学,主要从事推荐系统开发,目前负责QQ音推荐线上工程及优化。

    平安人寿智能风控体系建设实践 

    DA数智大会2025 · 深圳站
    陈依云
    平安人寿 数据挖掘专家

    从事数据挖掘相关工作10年,负责公司寿险领域核保风控模型、理赔自动化等模型开发,参与基于大模型的chatBI项目研发。参与的风控模型项目曾获得“燕梳奖”、“金信通”奖等荣誉。

    大模型在数据安全领域的应用探索 

    DA数智大会2025 · 深圳站
    林伟壕
    微信 高级安全工程师

    拥有十多年企业安全建设经验,先后在网络安全(电信集团)、运维安全(网易游戏)、研发安全(腾讯)领域深耕多年,参与过百 G 级 DDoS 防护系统、百万级主机入侵检测系统与十亿级代码安全扫描系统建设,目前主要负责数据防泄漏、数据合规技术能力建设,以及安全风险系统化解决。

    HyperGPU:机密计算释放通用GPU算力,构筑大模型密态算力底座

    DA数智大会2025 · 深圳站
    徐基明 博士
    蚂蚁密算科技 基础设施技术专家

    蚂蚁密算科技密码算法专家,北京大学博士后,在ASPLOS、MICRO等会议发表多篇论文成果,所设计密码方案在金融密码杯创新赛两次获奖,首个隐私计算一体机国际标准的主要贡献人之一,目前负责密态大模型场景下的密码安全设计。

    证券知识库构建及应用

    DA数智大会2025 · 深圳站
    毛瑞彬 博士
    深圳证券 数据中心负责人

    毛瑞彬 博士,深证信息数据中心负责人,研究领域为金融领域大数据与自然语言处理技术,参与科技部和深圳市多项课题研究;获2019年广东省优秀大数据案例TOP 30奖、2020年度中国人民银行金融科技发展二等奖;近年来在自然语言处理和知识图谱方面有多篇论文发表和专利授权。

    从提示词到评估指标:构建银行场景下的大模型应用评价体系 1405460843617065.png

    DA数智大会2025 · 深圳站
    韩方巍
    汇丰科技 人工智能研发专家

    现任汇丰实验室人工智能研发工程师,拥有多年人工智能与机器学习领域的一线研发经验。目前专注于大语言模型在银行业务中的应用实践,聚焦模型能力评估、提示词工程及自动化优化流程的系统建设,推动大模型技术在金融行业的安全、可控、高效落地。

    AI 原生驱动 RBF 生态协作网络的认知重构与探索实践

    DA数智大会2025 · 深圳站
    罗意
    滴灌通集团 高级技术副总裁 & 首席架构师

    目前负责滴灌通澳门金融资产交易所数科团队的技术架构与数据智能规划落地。


    疫情期间,在腾讯会议主导账号、运营、商业化等 SaaS 系统研发,成功支撑月活 2 亿 + 的高并发流量。此前在广发证券、uSmart 证券担任架构师及技术合伙人,落地覆盖 A 股、港股、美股的全球行情交易与智能投顾系统,具备丰富的金融科技与 SaaS 数字化系统建设经验。

    数智化下的财务变革:知识图谱与AI融合驱动下的财务新生态

    DA数智大会2025 · 深圳站
    钱亮
    顺丰 后端开发高级工程师

    钱亮负责财务公司核心系统的整体架构设计与建设,包括银行核心系统、监管报送系统、监管数据仓库、财司官网等关键业务系统。主导多个金融级高可用、高并发系统的架构设计与落地,具备12年以上银行、支付及相关金融系统的架构设计与研发落地经验。在智慧社区项目中,负责支付平台的整体架构设计与开发,支撑多场景支付业务,并实现高安全性、可扩展性的服务化架构。


    曾主导旅游电商平台的研发与架构设计,支持景区票务、商品销售、会员体系等多个核心模块,成功支撑高峰期百万级访问量。深耕微服务、分布式架构、中台化设计、数据治理等领域,熟悉Spring Cloud、Kubernetes、AI等主流技术栈。

    百度智能化研发落地实践

    DA数智大会2025 · 深圳站
    杨经纬
    百度 工程效能部前端研发经理

    百度工程效能部前端研发经理,负责文心快码Comate、DevOps工具平台、Comate Stack AI原生研发工具链等业务前端研发团队,在软件研发智能化、DevOps、研发提效、前端研发技术、技术团队管理等领域有着丰富的经验,并在相关领域著有发明专利8个,国家高质量专项《基于大模型技术的工业领域智能化开发工具项目》技术骨干。

    数据和AI融合研发效能提升实践——基于平台工程的群核科技研发效能IDP体系建设 

    DA数智大会2025 · 深圳站
    胡广寰 博士
    杭州群核科技(酷家乐)资深技术总监

    毕业于浙江大学计算机系,获得博士学位。拥有20余年互联网和软件行业经验,先后就职于了Ask.com、淘宝、菜鸟、酷家乐,在搜索引擎技术、大数据工程技术、Web应用开发、研发效能提升、云原生架构和基础设施建设、AI应用开发、信息和数据安全等技术方向有深入研究和实践。

    解决 Coding Agent 知识积淀和盲写问题两大难题的方法与实践

    DA数智大会2025 · 深圳站
    王振威
    Gbox AI CTO

    多年 Cloud Infra,DevOps,AI Agent 领域经验。前氦三科技 CEO,曾任职 Coding.net / 腾讯云高级研发总监。

    从数据到药物:多模态大模型在AI for Science中的高效实践

    DA数智大会2025 · 深圳站
    李昱 博士
    IDEA 研究院主任研究员、AI4Science负责人

    博士毕业于新加坡国立大学,曾是UIUC高等数字科学研究中心研究员、Blackmagic Design资深算法专家、以及腾讯ARC实验室创始成员,长期致力于生成式人工智能的研究与工业界应用落地转化,多项研发的能力进入到工业界顶尖产品中创造实际价值。在AI领域的多个顶级会议(包括CVPR、ECCV、NeurIPS、ICLR和ICML)担任领域主席。迄今为止,已发表60多篇高水平学术论文和期刊文章,谷歌学术引用过万。2022年起连续入选斯坦福前2%科学家榜单。2023年深圳市人工智能自然科学奖获得者。

    超越 RAG:迈向智能体时代的 Agentic RAG

    DA数智大会2025 · 深圳站
    李晓鹏
    香港城市大学 博士

    AI视频技术驱动跨境电商增长:VidAU.ai如何实现转化率提升40%与成本降低90%

    DA数智大会2025 · 深圳站
    刘振华
    位道科技 CTO

    毕业于电子科技大学通信硕士,中山大学岭南学院-麻省理工Sloan学院国际工商管理双硕士。


    任职vidau.ai CTO,曾担任腾讯(TME)高级产品总监、盛大创新院云计算产品负责人。14年研发管理与商业化实践经验,目前在AI+跨境出海领域深耕。

    受邀担任广州美术学院AIGC客座教授,阿里国际人工智能孵化中心特聘导师。发表3项专利和10余篇论文,出版了《AIGC数字艺术设计·零基础入门》。

    Agent 应用实现新一代家居设计制造数字化转型

    DA数智大会2025 · 深圳站
    曹健
    三维家 首席产品官

    三维家首席产品官&合伙人,从事家居设计软件12年,所负责产品为3D设计软件,VRAR全景,数字孪生等技术。SaaS软件订阅超过100w用户,创造超过10亿营收规模SaaS产品。


    MoonAgent:为 Moonbit 编程语言定制的 Code Agent

    DA数智大会2025 · 深圳站
    祝海林
    IDEA研究院基础软件中心 AI辅助编程专家

    Auto-Coder/Byzer-SQL 作者,前 Kyligence 技术合伙人,IDEA 研究院,目前致力于使用AI赋能数据领域和编程,研发MoonBit语言的Code Agent: moonagent. Byzer-SQL 获得22年中国开源创新大赛二等奖,23年浦东新区人工智能创新大赛一等奖,Auto-coder 获 Gitcode 24年度十大开源项目,个人获得 Gitcode 24年度开源人物,个人入选中国22年开源先锋33人,荣获23年全球人工智能开发者先锋大赛"开发者先锋"称号。


    LLM在微信实验系统中的应用 1408007663617065.png

    DA数智大会2025 · 深圳站
    熊涛
    腾讯微信 后台开发工程师

    2017年硕士毕业于浙江大学计算机专业。2018年至今,就职于微信实验平台,负责实验配置后台,指标计算系统,统计方法的相关研发工作。熟悉C/C++后台系统开发,大数据应用开发(Spark, Clickhouse),统计学基本原理。申请发明专利十余项,发表VLDB一作论文一篇。


    AI智能体在顺丰运营环节的应用

    DA数智大会2025 · 深圳站
    刘子恒
    顺丰科技 规划与资源决策算法总监

    刘子恒,顺丰科技营运网络智能决策主要负责人,2016年加入顺丰,负责顺丰陆运、航空物流网络的智能决策解决方案搭建工作,从0到1搭建了智慧物流网络决策支持系统,基于海量人、车、货、场数据,集大数据、智能算法、作业平台建设等关键技术于一体,解决场地选址、线路规划、运力资源储备及调配等难题,搭建可视化的端到端智能决策平台,算法与业务融合共生,以帮助数以万计的网络规划、运力规划及调度人员降低决策成本,提升运营效率及质量,已经广泛应用于顺丰各个业务场景。曾获得2025 Franz Edelman Finalist Award等重量奖项。

    无人化监控大规模交易市场:实时大数据+ AI Agent在业务指标自动监控与自动归因分析中的实践 

    DA数智大会2025 · 深圳站
    王冠峰 博士
    Grab Head of Engineering

    王冠峰博士毕业于新加坡国立大学,曾在 FujiXerox Research Lab 担任研究员,现任 Grab R&D 的履约中台部门技术总监。在国际顶级会议上发表论文40余篇。

    大模型驱动:金融业智能运营中枢的技术架构与实践 资源 1@4x.png

    DA数智大会2025 · 深圳站
    唐贤达
    汇丰科技 自动化平台赋能中心高级副总监

    汇丰科技自动化运营赋能中心技术主管,拥有多年在金融行业数字化转型领域的实战经验,致力于将自动化和智能化技术应用于企业数字化转型。

    平安人寿的AI赋能数字化运营实践

    DA数智大会2025 · 深圳站
    莫洋
    平安人寿科技研发部 AI产品负责人

    现任平安人寿科技研发部AI产品负责人,曾任平安人寿渠道创新应用团队负责人、平安人寿董事会办公室数字化改革专家,前百度机器学习专家。推动AI赋能寿险业务体系化落地。


    带领团队获得国际/国家/省级重磅奖项18个;学术竞赛世界冠军10 个;国际顶会论文16篇;12项国际国家专利;国际学术会议审稿人。

    大模型产品运营之路

    DA数智大会2025 · 深圳站
    卢馨婷
    顺丰科技 大模型高级产品运营经理

    顺丰科技高级产品运营经理,先后在字节跳动、顺丰同城等多家公司工作,擅长全链路产品运营,通过产品设计*数据运营*组织协同打造增长飞轮。从0到1搭建顺丰科技AIGC产品运营体系,助力大模型产品在物流垂域场景化和智能化,实现降本、增效、增收的业务目标。

    开天情感陪伴大模型研发及应用实践 1408007663617065.png

    DA数智大会2025 · 深圳站
    马金龙
    趣丸科技 媒体算法负责人

    研究生毕业,10+年算法研发经验,CCF专业会员,参与语音识别评测T/ISC 0034-2023标准制定,负责过音频前后端处理,弱网优化,音视频质量提升,智能内容安全审核“T网”,内容理解“T悟”等大型项目,目前主要负责AIGC类算法研发,包括自研LLM领域大模型,语音大模型,图像生成等。曾作为“灵声讯”创始人,参与智能媒体技术自媒体运营和推广。


    大模型助力抖音用户体验智能化

    DA数智大会2025 · 深圳站
    蔡聪怀
    字节跳动 算法专家

    哈尔滨工业大学硕士毕业,先后就职于腾讯、字节跳动。从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。

    活动主办方