微信分享
DataFunCon 2024·北京站:大数据-大模型双核时代

使用微信扫一扫分享到朋友圈

活动分享
DataFunCon 2024·北京站:大数据-大模型双核时代

使用微信扫一扫进入小程序分享活动

会议介绍

DataFunCon 2024·北京站

大数据-大模型双核时代


2023“百模大战”热潮渐落,2024年大模型迎来落地应用的突破。凭借预测能力及决策辅助作用,大模型注入了企业经营的每个环节。从产品研发创新,到运营和营销,到用户服务,深刻改造企业内核。


提及这两年互联网行业的焦点,“大模型”无疑是TOP话题,曾经火热的大数据架构看似淡出了公众视线。但是,大数据领域并未放慢脚步,反而也在快速发展,从繁多的开源组件堆砌而成的传统大数据平台,转向融合与简化为核心特质。业内共识在于,新一代数据架构将聚焦在高度集成化与简化设计上,这一转型将催生更高性能的智能基础设施。


“大模型”与“大数据”两者犹如车之双轮,合力驱动数据价值和企业价值的增长。大数据和大模型,作为双核驱动力,正在引领我们迈向更加智能、高效和便捷的时代。


DataFunCon2024北京站线下大会,将聚焦于大数据和大模型的融合发展,探讨如何利用这两大引擎推动智能时代的进步。

与行业专家,探讨数据智能落地的现在与未来。

峰会主席
选题策划委员会
  • 腾讯数据平台部总监,腾讯大数据平台产研负责人陈鹏
    陈鹏
    腾讯数据平台部总监,腾讯大数据平台产研负责人

    个人介绍:腾讯数据平台部总监,腾讯大数据平台产研负责人,2012年加入腾讯,曾就职于comodo、支付宝,十五年大数据领域研发经验,对搜索引擎、分布式计算以及数据分析等技术有丰富的研发经验,目前主要负责大数据基础平台、数据应用平台以及商业化产品的团队管理和系统研发。

  • vivo AI 算法负责人陈晓昕
    陈晓昕
    vivo AI 算法负责人

    个人介绍:vivo AI算法负责人,主导vivo蓝心大模型及AI算法团队的研发与管理工作。


  • 阿里巴巴 企业智能算法负责人陈祖龙
    陈祖龙
    阿里巴巴 企业智能算法负责人

    个人介绍:阿里巴巴企业智能算法负责人,资深算法专家,浙江省人工智能协会智能制造分会百人专家,山东人工智能协会专家成员,中国“双法”学会数学建模分会理事,现负责面向大型企业的数字化智能文档、企业级办公助手以及法务等领域大模型相关工作,曾负责阿里巴巴飞猪算法(搜索、推荐、广告、供应链等)团队和淘宝首页人群个性化推荐,带领团队在业务相关技术走向国内外先进水平,在WWW、SIGIR、SIGKDD、ICDE、WSDM、CIKM、AAAI等国际顶级会议和VLDB、TITS、TOIS、ITOJ、TACL等国际顶级期刊发表论文40多篇等。

  • 伊利集团 数据技术经理/大数据技术团队负责人姜涛
    姜涛
    伊利集团 数据技术经理/大数据技术团队负责人

    个人介绍:从事大数据技术领域相关工作,目前主要负责伊利集团大数据技术体系建设、业务赋能、以及大数据技术团队管理工作。

  • 西门子IT技术经理李朝明
    李朝明
    西门子IT技术经理

    个人介绍:毕业于北京航空航天大学,任职于西门子(中国)有限公司,负责西门子集团 IT 的大数据,人工智能,低代码


  • 马上消费金融 AI研究院副院长邓伟洪
    邓伟洪
    马上消费金融 AI研究院副院长

    个人介绍:马上消费金融AI研究院副院长,作为主要研究人员参与 OpenCV等开源项目的研发工作,长期致力于多模态大模型和计算机视觉系统的理论研究和实用化落地,在 CVPR、TPAMI 等顶级会议和期刊上发表100多篇文章,谷歌学术引用15000多次,曾获北京市优秀博士学位论文奖、北京市科技新星项目、国家级青年人才项目,2023年入选斯坦福“全球前2%顶尖科学家”和科睿唯安“全球高被引科学家”榜单。

  • 美团点评研究员李滔
    李滔
    美团点评 美团点评研究员
    博士毕业于中国科学技术大学。曾任职于日本理光、Teradata等公司。2016年加入美团,从0建立了外卖的智能营销方向,通过引入个性化定价策略大幅提升营销业务收益。同时搭建外卖数据挖掘团队,建设了数十亿规模的美食知识图谱。目前任美团外卖事业部数据和算法方向负责人,同时也是美团技术委员会算法通道委员
  • 360人工智能研究院 算法专家刘焕勇
    刘焕勇
    360人工智能研究院 算法专家
    360人工智能研究院算法专家、知识图谱方向负责人、360智脑项目组核心成员,“老刘说NLP”公众号作者,曾就职于中国科学院软件研究所。主要研究方向为大模型数据挖掘与自动化评估、领域知识/事件图谱的构建与落地应用,主持或参与研制全行业事理图谱、百科图谱、知识图谱平台、事件情报分析、右侧推荐、大模型研发等落地项目,申请发明专利十余项、论文数篇。近年来在OGB-Wikikg2、CCKS多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在github开源项目60+,收获star数超2W+。
  • 腾讯 IEG Global 海外游戏数据SRE负责人刘杰
    刘杰
    腾讯 IEG Global 海外游戏数据SRE负责人

    个人介绍:腾讯海外游戏数据工程专家工程师,曾作为腾讯游戏第一代数仓首席架构师主导第一代游戏数仓建设工作,在离线数仓,实时数仓,数据资产治理等多个大数据领域有丰富的实战经验。 目前担任腾讯海外游戏大数据技术中台SRE负责人,负责海外大数据技术中台全球的基础设施规划,数据质量治理,数据应用效率管理,成本管理,数据合规与数据安全等SRE工作。

  • 机器学习平台部总监陶阳宇
    陶阳宇
    腾讯 机器学习平台部总监

    个人介绍:中科大博士,15年机器学习、大数据、云计算相关领域经验,曾在微软MSRA、阿里云从事大规模分布式系统研发,现任腾讯TEG机器学习平台部总监,腾讯-太极机器学习平台研发负责人,研发的腾讯Angel系列AI框架,支持了腾讯海量数据、万卡规模GPU集群的模型训练、推理部署,服务了腾讯混元大模型、广告/内容推荐、金融风控等业务场景。

  • Datablau数语科技 创始人&CEO王琤
    王琤
    Datablau数语科技 创始人&CEO

    个人介绍:Datablau数语科技 创始人&CEO

    信通院数据资产专家委员会成员,数据资产管理实践白皮书主要撰写人之一.

    国资委数据要素专家组成员,中国电子商会数据要素发展工作委员会理事

    DAMA CDMP,IEEE member, TheOpenGroup member,DAMA中国数据架构、数据模型专委会牵头人。

    复旦大学、北京航空航天大学、人民大学 客座讲师

    清华大学经管学院EMBA,北京大学硕士,北京理工大学本科

    《数据架构之道》作者,《数据血缘》译者


  • 大数据基础架构负责人、大数据架构师王海华
    王海华
    货拉拉 大数据基础架构负责人、大数据架构师
    王海华,货拉拉大数据架构师/基础架构负责人,现在负责公司大数据部门整体稳定性、安全、成本和基础架构团队。曾在滴滴/饿了么/拼多多经历和负责过几千到几万台的超大规模数据平台架构。7年以上大数据架构经验,主要研究方向是大数据安全、大数据平台产品和系统架构、计算机体系结构和分布式系统等,在以上领域具备大规模的落地实践经验。腾讯云TVP,曾经多次在QCon/SACC/DTCC等著名技术会议上进行技术分享。
  • 数据科学专家,微信实验平台负责人王勇
    王勇
    微信 数据科学专家,微信实验平台负责人
    微信实验平台负责人,数据科学专家,同时负责工程和算法团队,发表多篇实验领域顶会文章。
  • 小米集团 大数据委员会 运营负责人卫伟
    卫伟
    小米集团 大数据委员会 运营负责人

    个人介绍:之前在百度,阿里等做To B产品运营及服务

  • 小质科技 技术VP杨克特
    杨克特
    小质科技 技术VP

    个人介绍:毕业于浙江大学计算机系,获硕士学位,具备10多年核心系统设计和研发经验。

    曾任阿里巴巴资深技术专家,参与和负责过搜索引擎、资源调度、实时监控等系统的设计和研发。主导 Apche Flink SQL 的发展,支撑阿里巴巴集团海量实时计算场景,以及云产品化工作。具备丰富的开源经验,是 Apache Flink 和 Apache Druid 的 PMC 成员,以及Apache 软件基金会成员。

    现任小质科技技术VP,负责产品的设计和研发工作。


  • 小布智能中心高级技术总监杨振宇
    杨振宇
    OPPO 小布智能中心高级技术总监
    杨振宇,OPPO小布智能中心认知计算技术负责人,深圳市高层次人才计划入选者,于中国科学技术大学获得计算机学士和博士学位。近年来主要从事自然语言处理、对话式AI相关算法研究与落地应用工作。2015年之前任教于国防科学技术大学,学术论文代表作单篇他引超过800次,入选ESI Top 0.1%热点论文。所从事科研工作曾获高等院校(科学技术)科技进步二等奖1次、湖南省科技进步二等奖2次。2015年后加入工业界,专注于对话式AI关键算法技术研发与落地,2018年加入OPPO主导NLP与对话算法工作,帮助公司级战略产品小布助手实现从零到月活过亿的突破。
  • 新浪微博 机器学习团队 新技术研发负责人张俊林
    张俊林
    新浪微博 机器学习团队 新技术研发负责人

    个人介绍:中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队新技术研发负责人,在此之前在阿里担任资深技术专家。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。

  • 酷狗音乐 业务风控架构师张萌
    张萌
    酷狗音乐 业务风控架构师

    个人介绍:我是酷狗安全架构师,在2018至2019年间专注于风控业务,负责架构设计和规则引擎的构建。在随后的两年,我深入数据安全领域,搭建了SDL管理体系和编码安全组件库,同时开发了数据加解密系统。2021至2022年间,我致力于个人信息合规工作,完善安全管理体系,并设计了APP合规检测工具。目前,我正专注于业务与账号安全,建设流量监测和安全运营中心,致力于提升安全数据的可视化,以不断强化我们的风控问题发现和响应机制。

  • 理想汽车 资深算法专家张升涛
    张升涛
    理想汽车 资深算法专家

    个人介绍:京东 -> 金山软件 -> 迅雷网络 -> 理想汽车 

    从事AI研究和应用13年,开发和推广了京东个性化推荐第一版,金山软件智能运维系统,迅雷网络推荐系统,目前在理想汽车致力于多模态生成式大模型的应用和推广。主导“理想5C超充场站”智能部分开发应用,以及KG+LLM企业级产品的研发落地。


  • 论坛出品人
  • 腾讯 研究科学家张驰
    张驰
    腾讯 研究科学家

    个人介绍:现就职于腾讯公司担任研究科学家。2021年博士毕业于新加坡南洋理工大学计算机学院。他的博士研究课题专注于高效低成本的机器学习和计算机视觉算法,目前的研究方向是大模型时代下的多模态模型与AIGC模型。曾在CVPR、ICCV、NeurIPS、TPAMI等顶级国际会议期刊上发表多篇学术论文。2023年入选美国斯坦福大学发布的《2023年度全球前2%顶尖科学家榜单》。

  • 云器科技  联合创始人|CTO关涛 Tony
    关涛 Tony
    云器科技 联合创始人|CTO

    个人介绍:云器科技联合创始人/CTO,分布式系统和大数据平台领域专家。
    前阿里云计算平台事业部研究员,阿里巴巴通用计算平台MaxCompute、Dataworks负责人,负责阿里巴巴主线大数据平台。前阿里巴巴和蚂蚁集团技术委员会计算平台领域组长、阿里云架构组大数据组组长。
    回国加入阿里云之前,在微软云计算和企业事业部工作 9 年,主持和参与开发了包括 Azure Datalake,Cosmos/Scope,Kirin在内的多套超大规模分布式存储和计算平台。并著有多篇国内外会议论文和专利。

  • 奇富科技  高级算法总监杨剑
    杨剑
    奇富科技 高级算法总监
  • 小米  小爱技术负责人秦斌
    秦斌
    小米 小爱技术负责人
  • 飞轮科技  Apache Doris PMC陈明雨
    陈明雨
    飞轮科技 Apache Doris PMC
  • 数势科技   CTO韩秀锋
    韩秀锋
    数势科技 CTO
  • 清华大学  助理教授龚江涛
    龚江涛
    清华大学 助理教授

    个人介绍:

    清华大学智能产业研究院助理教授,曾任联想集团研究院技术战略与创新孵化平台高级研究员,负责智能系统交互技术研发、类人智能体、认知及情感计算相关研究。曾作为项目负责人、课题任务负责人承担了包括北京市、科技部、工信部等多项科研项目,发表人机交互领域顶级会议或期刊论文40余篇、获得20余项国内外发明专利。


    演讲题目:

    具身认知增强的大语言模型Agent


    演讲提纲:

    大语言模型为AI Agent带来了人类世界common sense,然而大语言模型自身的训练数据嘈杂且缺乏具身性。为了增强大语言模型AI Agent的具身性,我们探索了多种方式,将具身任务数据与语言模态数据进行对齐。使大语言模型AI Agent可以更好地完成如驾驶、社交等具身任务,揭示了AI Agent实现通用人工智能的潜力。


    听众收益:

    1、大语言模型除了处理文本任务,如何完成具身任务?

    2、大语言模型完成具身任务的好处是什么?

    3、大语言模型完成具身任务面临什么样的挑战?

    4、构建具身认知增强的大语言模型Agent有哪些思路方法?

  • 百度  商业策略中台技术负责人杨羿
    杨羿
    百度 商业策略中台技术负责人
  • 滴滴出行 专家工程师刘超
    刘超
    滴滴出行 专家工程师

    个人介绍:硕士毕业于南京信息工程大学,一直从事数据领域相关工作。
    2018年加入滴滴。目前负责滴滴大数据治理的相关工作。通过持续地推动技术&产品能力建设,对滴滴大数据的数据引擎(hadoop、es、flink、olap等)&数据产品,进行全域治理。
    近期的工作重心为成本治理、安全治理两个方向。

  • 华为  文本机器翻译实验技术专家陶仕敏
    陶仕敏
    华为 文本机器翻译实验技术专家

    个人介绍:华为2012 NMT Lab,技术研究及创新负责人,技术专家。曾任百度运维平台及智能运维技术经理。主要研究方向:机器翻译,多语言数据智能,NLP for ICT,AIOps等。

  • 小红书  数据引擎负责人季钱飞
    季钱飞
    小红书 数据引擎负责人

    个人介绍:

    硕士研究生学历

    10年+大数据领域经验

    星环信息科技初创成员

    现在是小红书数据引擎负责人,负责大数据存储、实时/离线计算引擎、湖仓架构等数据产品和平台的研发工作。

  • 活动嘉宾
  • 理想汽车   AI算法专家张升涛
    张升涛
    理想汽车 AI算法专家

    个人介绍:

    京东 -> 金山软件 -> 迅雷网络 -> 理想汽车

    从事AI研究和应用13年,开发和推广了京东个性化推荐第一版,金山软件智能运维系统,迅雷网络推荐系统,目前在理想汽车致力于多模态生成式大模型的应用和推广。主导“理想5C超充场站”智能部分开发应用,以及KG+LLM企业级产品的研发落地。


    演讲题目

    LLM在数据分析领域的实践应用


    演讲介绍和提纲:

    1. 问题引入:

    (1)传统BI的痛点

    (2)新一代BI的实现思路

    (3)端到端BI的探索

    2. 问题解决:

    (1)可信赖领域大模型

    (2)KG+LLM 在BI系统的新尝试

    (3)知识内化的两种方式 

            a. pretrain+finetune;

            b. 基于KG的结构化推理内化

    (4)业务口径对齐 PPO or DOP

    (5)LLM与归因分析

    (6)基于KG的归因

    (7)智能归因 Agent实现思路

    3. 展望:

    (1)指标建设端到端BI的基石

    (2)数仓大模型:专注于数仓构建

    (3)“逻辑数仓”新概念与实现思路


    听众收益:

    1. 了解LLM在数据分析以及BI领域的最新进展

    2. 获得新一代BI探索的新方向

    3. 了解如何利用LLM解决实际的数据分析问题

    4. 了解将通用大模型应用到自己的业务问题的一种最佳实践

  • 清华大学  助理教授龚江涛
    龚江涛
    清华大学 助理教授

    个人介绍:

    清华大学智能产业研究院助理教授,曾任联想集团研究院技术战略与创新孵化平台高级研究员,负责智能系统交互技术研发、类人智能体、认知及情感计算相关研究。曾作为项目负责人、课题任务负责人承担了包括北京市、科技部、工信部等多项科研项目,发表人机交互领域顶级会议或期刊论文40余篇、获得20余项国内外发明专利。


    演讲题目:

    具身认知增强的大语言模型Agent


    演讲提纲:

    大语言模型为AI Agent带来了人类世界common sense,然而大语言模型自身的训练数据嘈杂且缺乏具身性。为了增强大语言模型AI Agent的具身性,我们探索了多种方式,将具身任务数据与语言模态数据进行对齐。使大语言模型AI Agent可以更好地完成如驾驶、社交等具身任务,揭示了AI Agent实现通用人工智能的潜力。


    听众收益:

    1、大语言模型除了处理文本任务,如何完成具身任务?

    2、大语言模型完成具身任务的好处是什么?

    3、大语言模型完成具身任务面临什么样的挑战?

    4、构建具身认知增强的大语言模型Agent有哪些思路方法?

  • 腾讯游戏 知几技术负责人邱东洋
    邱东洋
    腾讯游戏 知几技术负责人

    个人介绍:西北工业大学计算机硕士,腾讯游戏AI工程师,腾讯智能交互产品“游戏知几”技术负责人。研究与实践领域主要聚焦于NLP、模型推理加速、系统架构与性能优化等。代表产品:游戏知几知识问答、“和平第五人”AI语音助手、天天象棋(无障碍版)、知音语音大模型、“绝智阿暖”智能NPC、基于LLM的人机协同智能客服解决方案等。


    演讲主题

    智能NPC:AI为游戏NPC注入灵魂,深度模型推理加速的术与道


    演讲介绍

    1、  大模型为游戏NPC发展带来的机遇

    2、   “绝智阿暖”NPC智能化尝试的一小步

    3、  智能NPC的核心挑战与解决方案

    4、   我们在NPC智能化的未来打算。


    听众收益

    1、  如何让LLM生成的内容与游戏世界观、游戏IP人设保持一致?

    2、   大模型的安全合规方案有哪些?

    3、   多模态交互下如何解决大模型的实时性问题?

  • 腾讯  高级算法研究员沈春旭
    沈春旭
    腾讯 高级算法研究员

    个人介绍:清华大学硕士,研究领域为多模态信息检索、推荐系统。2018年加入腾讯,高级算法研究员,主要从事用户增长相关算法研发,研究成果主要发表在ACL、EMNLP、AAAI、IJCAI等领域顶会。


    演讲题目

    大模型技术在微信Feeds流推荐场景落地实践


    演讲介绍

    大模型技术在微信Feeds流推荐场景落地实践,主要包括: 1. LLM推荐方案综述 2. 特征增强器:LLM提供增量开放知识,优化推荐Backbone 3. 生成式推荐:难点、多模式、技术突破、效果分析


    听众收益

    1.  LLM优化现有工业推荐系统的几种方案

    2.  百亿级生成式推荐大模型稳定训练技巧


  • 百度  资深研发工程师彭阳
    彭阳
    百度 资深研发工程师

    演讲题目

    大模型在研发数据中台的应用实践


    演讲介绍

    本次演讲主要包含两个部分,研发中台数仓的构建以及探索如何结合大模型的技术,提升中台业务方解决线上问题的效率。通过构建离线及实时数仓,我们为业务方提供了决策判断依据,使业务方能够基于关键指标进行有效的决策。进一步地,通过将大模型技术与业务流程相结合,能够针对线上问题提供直接的解决和修复方案,从而优化整个问题解决流程。


    听众收益

    1.  研发数据中台的架构和数仓建设思路介绍

    2.  数仓的离线、实时数据建设思路以及流量突增应急方案

    3.  如何将大模型赋能研发数据中台的业务


  • 百度 资深研发工程师边江
    边江
    百度 资深研发工程师

    个人介绍:百度资深研发工程师,研究方向为数据科学、智能系统,在大模型应用和数据挖掘领域有丰富的实践经验。他参与百度飞桨、文心一言等深度学习技术、大模型技术研发,担任科技创新2030人工智能重大项目子课题负责人,CCF普适计算专委会执行委员,IEEE会员。


    演讲题目

    基于大模型的数据工程与数据科学解决方案


    演讲介绍和提纲

    高效准确的数据操作是数据工程、数据科学的重要组成部分。而大量商业/数据分析师或不具备编写数据查询(如 SQL或 Gremlin)代码能力。本次分享主要介绍了星致助手——基于大模型的数据工程与数据科学解决方案。星致助手是一种全新的基于自然语言交互的数据分析 AI 原生应用,旨在降低数据使用门槛、减少研发成本,解决传统查询流程复杂、取数流程长和现有的 NL2SQL 能力有限等问题。它由全过程无需人工操作和复杂工具使用,以聊天的形式与助手沟通即可快速、高效、精确的完成探索性数据分析需求。


    听众收益

    1、大模型数据科学领域典型应用

    2、  prompt实操(文心一言)

    3、  数据查询、分析、可视化全流程提效

  • 滴滴  数据分析师万博揆
    万博揆
    滴滴 数据分析师

    个人介绍:2021年6月本科毕业于南方科技大学统计与数据科学系;2023年1月硕士毕业于新加坡国立大学统计与数据科学系;2023年1月至今于滴滴数据科学中台担任数据分析师,主要负责随机分流实验各环节的优化。


    演讲题目:随机实验AA问题的系统解决


    演讲内容:

    AB实验虽然作为决策的黄金准则,但当AA问题存在时,其结果的有效性也饱受质疑,而解决AA问题的方式多种多样,重随机和回归调整相结合作为其中最有效的一环,可以有效缓解AA问题,防范于未然,增强实验结果的可信度。

    提纲:

    1. 重随机的学界与工业界调研
    2. 重随机的原理展示与数据模拟
    3. 重随机的实际应用与注意事项


    听众收益:

    1. 了解协变量平衡的进展
    2. 熟悉重随机的底层原理
    3. 掌握实际中如何使用重随机缓解AA问题


  • eBay  数据分析经理吴维维
    吴维维
    eBay 数据分析经理

    个人介绍:上海财经大学统计学本科&硕士,2018年毕业,曾也就业于字节跳动在线教育&TikTok、蔚来汽车自动驾驶运营,现于eBay中国分析中心担任数据分析师工作,负责跨境交易品类分析与卖家管理业务。


    演讲题目:基于Uplift Model的优惠券分发优化


    演讲内容:智能营销正渗透到各行各业,期望通过营销手段来促进用户的行为。其面临的核心问题是:如何衡量营销干预带来的"增量效果",即如果没有营销干预用户的表现是怎样?避免在那些"本来就会转化"的用户身上浪费营销预算。
    本项目将以电商商家补贴活动为例,介绍基于Uplift Model如何构建营销增益模型,锁定营销敏感人群,驱动投放策略制定。


    听众收益:

    1. 通过实例分析了解uplift model因果推断方法论
    2. 因果推断方法如何寻找模型最优解
    3. 如何讲因果推断思维广泛应用于商业世界提高企业效率



  • 智慧芽首席架构师,大数据负责人金路
    金路
    智慧芽首席架构师,大数据负责人

    个人介绍:南京邮电大学本硕,先后就职于 IBM/Oracle/美团/智慧芽。前期主要从事云原生相关工作,包括负责大众点评Web站/APP的主站核心,构建高可用和海量并发的云原生服务。目前在智慧芽负责大数据工作,涵盖各类技术和平台架构、数据治理、数字化运营等。


    演讲题目:数据工程和大模型互相驱动的技术展望


    演讲内容:

    1. 数据工程和AI结合的历史背景

    2.  大模型驱动的数据工程和治理

    3.  数据工程和治理驱动的大模型建设

    4.  ETL加ECL构建数据智能


    听众收益:

    1.数据和AI结合的历史背景,了解原来的数据工程和治理是如何使用传统AI进行增强
    2.了解大模型如何赋能数据工程和治理的一些节点插上腾飞翅膀
    3.语料库建设和治理如何帮助大模型成功实施
    4.ETL到ECL的数据工程模式转变,如何帮助大模型实现应用落地


  • 知乎  数据智能部负责人张亚峰
    张亚峰
    知乎 数据智能部负责人

    个人介绍:知乎智能算法部负责人,负责知乎知海图大模型、推荐、搜索、广告、增长等方向的算法和架构。12年搜广推算法经验,曾创业2年,在美团等多家互联网公司负责或组建多个核心业务算法团队,建立支撑亿级用户、日交易额数亿、日算法补贴额数千万的多个超大规模复杂算法系统,热衷技术,实践经验总结有数篇NIPS、KDD、Recsys等顶会论文,多次获得机器人大赛冠军。


    演讲题目:大模型应用用户产品中的机遇和挑战


    听众收益:探讨大模型相关技术,并就大模型应用用户产品中的机遇和挑战展开讨论


  • 小米  数据科学家刘文凯
    刘文凯
    小米 数据科学家

    个人介绍:北京邮电大学计算机硕士,曾就职于微软、高德、微博及第四范式,专注于大数据与人工智能方向的研究,后在小米主导用户画像,目前专注于推动大模型技术在大数据领域中的创新与实践。


    演讲题目:数据问答新纪元:大模型如何塑造数据产品的明天


    演讲内容:

    随着企业数字化转型的加速,数据资产已成为企业最宝贵的财富之一。如何降低数据获取的门槛,提高数据消费的效率,让更多的人使用数据,充分发挥数据的价值,已成为企业和个人面临的一大挑战。在这一背景下,人工智能技术的突破为我们提供了新的解决方案,尤其是大语言模型(Large Language Model, LLM)如ChatGPT和GPT4的出现,它们以其强大的语言处理和生成能力,正在全面重塑数据产品的开发和使用范式,引领我们进入一个全新的数据交互时代。本次演讲将带您走进数据问答的前沿领域,深入探索如何高效地与数据进行对话,利用大语言模型技术塑造数据产品的明天,进而打造一套面向大数据的LUI人机交互新模式,以期实现更智能、更自然的数据交互体验。

    提纲
    1. 数据使用的挑战
    2. 大语言模型的崛起
    3. 数据问答技术的演进
    4. LLM在数据问答中的应用
    5. 塑造数据产品的未来


    听众收益:

    1. 技术前沿洞察:深入理解人工智能如何作为驱动力,引领数据问答技术的革新与发展
    2. 实践技能提升:掌握在数据问答领域对大模型进行微调的技巧,以优化模型性能
    3. 连续交互优化:学习如何高效运用大模型,实现数据问答中的流畅连续交互,提升用户体验
    4. 创新模式探索:洞悉面向大数据领域的LUI人机交互新模式,为未来交互设计提供灵感

  • 理想汽车 高级软件工程师刘标
    刘标
    理想汽车 高级软件工程师

    个人介绍:

    2015-2022 汽车之家资深架构师 负责金融部门研发、数据开发相关工作

    2021-至今 理想汽车高级软件工程师 负责模型推理、加速相关工作


    演讲题目:RAG在复杂场景的实践经验分享


    演讲介绍和提纲:

    part1

    介绍下行业内RAG的应用场景

    RAG现状、对比

    引入理想汽车的需求背景

    part2

     理想汽车RAG的工程落地

    KG库更新、召回策略实现

    全链路追踪及评价体系的痛点及实现

    badcase自动化修复方案

    知识图谱在RAG中应用

    智能归因的工程落地

    part3 

    展望

    RAG2.0


    听众收益

    1.RAG在实际项目中如何快速落地

    2.在复杂场景中会带来哪些问题及对应的解决方案


  • 理想汽车 算法开发工程师江晓龙
    江晓龙
    理想汽车 算法开发工程师

    个人介绍:从事NLP相关工作6年以上,紧跟自然语言头部发展技术路径。对先进的技术应用有实际的心得体会,有时间序列异常检测项目落地经验。


    演讲题目:时序预测大模型对真实指标预测的真实场景应用


    演讲介绍:

    最近两年大模型在自然语言处理、视觉方向百花齐放,层出不穷的技术创新、探索、及真实业务场景落地。而时间序列预测任务相较NLP、CV的应用任务具有有明显的差异,目前业界没有统一有效的应用范式或模型,本次分享将围绕大模型在一个实际场景的应用效果进行介绍。


    听众收益

    大模型在时间序列预测相较于传统模型的效果展示、分析;讨论几种时间序列数据预处理的方式及效果;讨论不同嵌入方式对时间序列特征提取的效果差异。


  • 360人工智能研究院资深算法专家刘焕勇
    刘焕勇
    360人工智能研究院资深算法专家

    个人介绍:

    360人工智能研究院知识图谱及文档跨模态方向算法负责人,曾就职于中国科学院软件研究所。主要研究方向为文档理解、知识增强。近年来参与360文档大模型、360智脑大模型及360百科图谱、商业化广告图谱、右侧推荐等落地项目研发,累计申请发明专利十余项、论文数篇,开源项目70余个,在OGB-Wikikg2、CCKS多模态实体对齐等多个评测任务中获得多项冠亚军,创立“老刘说NLP”技术社区,具有广泛影响力。

    RAG落地中的知识库建设、现实坑点及应用探索


    演讲介绍和提纲:

    RAG检索增强大模型问答,已经成为大模型进行领域落地的重要范式,其在取得广泛应用的同时,也面临着诸多挑战。而作为检索的对象,如何对复杂多样的领域文档进行精细化处理十分必要,本报告将重点介绍我团队在文档理解及知识库方面的一些探索实践,包括KG-RAG,知识图谱与大模型相结合,并对当前团队在文档应用场景上做的一些探索性工作进行汇报。


    听众收益:

    1、RAG过程中的文档处理范式及存在问题?

    2、KG-RAG在落地过程中有哪些实现范式?

    3、RAG在文档场景中有哪些可落地的结合点?

    4、RAG的前沿可跟踪方向

  • 活动日程
    2024-07-05
    2024-07-06
    2024-07-05
    09:00 -12:00
    主题论坛:大数据·大模型·双核时代
    2024-07-05
    14:00 -17:20
    重构数据基建:新一代数据架构
    2024-07-05
    14:00 -17:20
    量化决策的艺术:AB实验与因果推断
    2024-07-05
    14:00 -17:20
    定制未来:大模型微调
    2024-07-05
    14:00 -17:20
    大模型增强用户体验与用户服务
    2024-07-05
    14:00 -17:20
    智能·高效 :大模型重塑个人助理与办公协作
    2024-07-06
    09:00 -12:00
    数据治理,企业智能化的命脉
    2024-07-06
    09:00 -12:00
    实时洞察,湖仓之力
    2024-07-06
    09:00 -12:00
    运维新蓝海:AIOps落地实践
    2024-07-06
    09:00 -12:00
    大势所趋:大模型驱动搜索与推荐
    2024-07-06
    09:00 -12:00
    大模型塑造产品研发新范式
    2024-07-06
    14:00 -17:20
    全球视野下的多云与混合云构建
    2024-07-06
    14:00 -17:20
    洞察业务本质:指标体系设计与应用
    2024-07-06
    14:00 -17:20
    信息挖掘新篇章:RAG检索实践
    2024-07-06
    14:00 -17:20
    AI Agent赋能场景革命
    2024-07-06
    14:00 -17:20
    大模型驱动运营与营销策略升级
    参会须知

    票务(2-1).png

    大会组织

    赞助商.png

    活动门票
    活动筹备中
    售票推广中
    活动结束
    选择票
    门票名称
    单价(¥)
    截止时间
    数量
    普通票(单人票 · 不含餐)
    5,000
    2024-07-06 18:00
    0
    普通票(4人团 · 不含餐)
    4,000
    2024-07-06 18:00
    0
    标准票(单人票 · 含餐)
    5,500
    2024-07-06 18:00
    0
    标准票(4人团 · 含餐)
    4,500
    2024-07-06 18:00
    0

    退票说明:不支持退票

    优惠或邀请码
    票价
    0
    活动地点