现任美团酒店旅行事业部数据团队负责人,聚焦数据智能在业务场景的产业化落地。拥有十年数据架构实战经验,曾参与数据平台方向从零到一的体系化建设,在实时计算引擎架构、流批一体特征工程平台、Data+BI融合分析体系等前沿领域具备一定积累,实现数据资产向业务价值的规模化转化。
重塑数据根基:Data+AI 多模态数据湖实战路径
演讲介绍
在数据量呈指数级膨胀与 AI 技术迭代加速的双重浪潮下,传统数据处理模式正遭遇价值挖掘的效能瓶颈。作为数据价值链条的核心枢纽,数据准备与挖掘环节亟待从「人力密集型」向「Data+AI 深度融合驱动」实现范式革新。构建兼具高效性、智能化与扩展性的大规模数据处理体系,已然成为企业数字化转型的决胜关键。
本次演讲将紧扣 Data+AI 前沿趋势,深度解析如何依托多模态数据湖等创新能力,搭建面向未来的新一代数据基础设施,并结合多行业实战案例,呈现技术落地的全景蓝图。
演讲大纲
1. 行业痛点:AI时代,非结构化数据带来数据存储、计算和治理困境,如数据孤岛、质量参差、多模态融合难
2. Data+AI的范式变化:Data+AI的飞轮效应,数据滋养AI 到 AI反哺数据治理
3. 多模态数据管道的工程实践:多模态数据管道的架构设计原理、关键组件实现以及性能优化技巧
4. 新场景探索与展望:多模态数据湖在数据预训练、后训练、数据挖掘等场景中的应用实践
听众收益:
1. 掌握Data+AI驱动的大规模数据系统设计原则,理解从传统ETL到智能管道的升级路径。
2. 获得多模态数据处理等场景的落地经验。
3. 了解数据挖掘与AI结合的未来趋势,明确技术规划方向。
盘活数据资产,驱动价值释放:数据仓库与ChatBI的融合之道
企业在经过多年的运营后,必然会沉淀出大量的数据资产和数据模型,具有个性化需求的数据不好找、找到不会用、用了数不对的问题依然严重,本次分享将介绍如何通过LLM技术构建符合业务个性化的ChatBI系统,并结合数仓的建模思想,利用已有的数据模型快速搭建数据集,提高数据的利用率,使数据资产流动起来,释放更多的价值。
演讲提纲
1. 背景介绍
2. ChatBI架构概览
3. ChatBI模块解析
4. 接入数仓数据
6. 数据的准确性评估(测试方案、内容版本方案)
7. 性能与成本的平衡
8. 落地实践
听众收益:
1.基于数据仓库的搭建ChatBI的契合点是什么?
2.如何数据建模让ChatBI更懂数据?
落地挑战和方案重点
1.如何让用户使用ChatBI数据更有信心?
2.数据查询的性能问题
酒店旅行在M端场景的数据智能化应用和探索
演讲介绍:酒旅业务小助手服务于酒旅事业部组织提效,借助大模型实现M端分析师、运营、销售各职能个人工作提效和跨职能的流程优化,我们围绕“数据-信息-策略-行动”建设核心能力,数据上,完成规模化取数能力的探索,信息上完成部分信息非结构化知识的接入,策略上实现了分析诊断和初步业务建议输出,行动上,将业务诊断建议的结果作用于播报工具、智能问答、销售等场景实现数据智能化闭环。
演讲大纲:
1. 架构革新:从传统指标仓库向AI驱动的数仓2.5层架构演进,实现分层架构的智能化简化
2. 资产转型:数据资产建设从服务人工分析转向支持人机协同的元数据体系建设
3. 能力升级:数据处理范畴从结构化数据扩展到非结构化知识增强与融合
4. 评估体系:构建端到端的AI取数准确性评估框架与方法论
听众收益:
1. 数仓扁平化架构升级:如何在传统数仓建模基础上实现数仓架构改造,并提升数据获取效率。
2. 非结构化知识清洗:如何基于业务实际know-why的非结构化知识,实现知识的运营管理和标准化清洗。
3. Agent架构演进:参照业界大模型的新技术实现预置工作流模式向自动生成工作流到智能体的演进。
落地挑战和方案重点:
1 AI取数场景的泛化问题
2 数据分析框架的泛化问题
3 预制工作流和agent的发展演进过程
4 数仓架构的宽表建模和性能优化
AI驱动的数据新基建
演讲介绍:
腾讯游戏在数据领域深耕多年,如今借助大模型技术,构建了高效的数据资产体系和智能应用架构。通过湖仓一体架构、重塑的资产体系、自助化分析能力等创新手段,实现了数据交付效率的大幅提升和资产复用率的显著增长。并结合具体的应用场景介绍模型、资产、应用三个方面的工程化融合方案,以及可持续运营体系的搭建策略。
演讲大纲:
一、腾讯游戏数据发展背景
1.1 腾讯游戏在数据工程发展
1.2 如何提高数据使用效率
1.3 新技术带来的数据资产变革
二、基于AI的资产体系建设
2.1 构建“人和AI”都能理解的资产
2.2 基于逻辑的资产模型
2.3 湖仓架构实时化改造
三、AI应用场景的探索
3.1 精细化运营的数据需求
3.2 应用工程技术架构
3.3 可量化的持续运营
听众收益:
1. 掌握前沿技术:了解大模型在数据服务中的应用,了解腾讯游戏的应用实践,为自身业务提供技术借鉴。
2. 优化数据资产:学习构建高效数据资产体系的方法,提升数据复用率,增强数据驱动业务的能力。
3. 提升运营效率:借鉴腾讯游戏的数据资产运营经验,掌握智能数据服务提高资产运营效率的策略。
落地挑战和方案重点:
1.数据资产建设与管理的复杂性:需要将业务需求、行业知识、数据结构等多方面因素进行整合,沉淀出高质量的领域模型和资产知识图谱。同时,资产的治理、优化和持续运营也面临诸多挑战,如如何确保资产的准确性、唯一性、复用性,如何根据业务变化及时调整资产结构等。
2.大模型等新技术的适配与稳定性:对于大模型的生成幻觉、知识库的匹配、湖仓架构等技术方向,如何保证架构的稳定性、可扩展性和高性能,以满足业务实时性和灵活性的需求。
