返回上一页 > 日程安排

企查查字段血缘的大模型实践

时间: 04 月 24 日 14:00 - 14:45
内容介绍:

面对企查查多源、海量企业数据带来的字段语义模糊、变更影响难评估等治理痛点,我们放弃了传统仅能解析表级血缘的工具,创新性地引入大模型技术。


我们的核心方案是设计精准的提示词工程,让大模型直接解析SQL脚本,同时完成字段级血缘链路发现与业务含义智能标注。落地中,我们重点攻克了大模型“幻觉”导致血缘不准的挑战,通过构建校验规则与人工复核闭环,将血缘准确率提升至95%以上。

该实践成效显著,目前已完成80%核心报表的字段血缘覆盖,使数据变更的影响分析耗时从“人天级”降至“分钟级”,极大保障了企查查亿级数据资产的可靠性与透明度。


演讲提纲:

一、背景:为何要在企查查做字段血缘
二、核心架构:大模型赋能字段血缘的“技术蓝图”
三、实践与挑战:落地过程中的“得”与“失”
四、总结与展望:价值回顾与未来演进

听众收益:

1、大模型在数据工程中的角色,可以从“副驾驶”升级为“自动驾驶员”。
2、字段级血缘的突破,能如何直接驱动业务敏捷性与数据可靠性。

日程嘉宾
DACon 2026 · 上海站
李卫星
企查查科技 大数据架构部数据组件专家

深耕大数据领域十年,拥有丰富的数据平台建设与治理经验。对数据架构、血缘治理有深刻理解,是资深的数据技术实践者与分享者。