返回上一页 > 专题演讲嘉宾
DACon 2026 · 上海站
王正
字节跳动云搜索资深研发工程师

拥有十余年云原生、大数据与 AI 基础设施研发经验。主导火山引擎多模态与混合检索、RAG 检索等能力在多个场景的工程化落地,在 OpenSearch、Milvus 等搜索与向量引擎以及高吞吐、低延迟的智能检索与生成系统架构,智能体(Agent)上拥有丰富工程实践经验,已获多项发明专利。致力于将前沿技术转化为可规模化落地的工程实践。

嘉宾日程:

ContextSearch:为 Agent 构建可进化的上下文层

#Agentic RAG:从检索增强到自主决策(出品人:太平洋保险集团 云首席专家兼AI中台负责人 王辉)

Agent 应用爆发式增长,但检索层面临三大失效:单轮查询无法支撑多步推理、静态索引滞后于业务迭代、多源数据割裂导致上下文碎片化。我们构建了 ContextSearch 一站式 Agent 上下文平台,采用 Agentic 导入、Agent Search、Context 治理三层架构。导入层通过 Code Agent 自动生成 Pipeline,将数据就绪周期从天级压缩至小时级;检索层基于 Planner-SubAgent-自评估链路实现多步推理,底座采用 RaBitQ+DiskANN 向量引擎,百亿规模下 P99 延迟降低 72.3%、QPS 提升 450%、存储成本下降 83.5%;治理层通过显式与隐式反馈闭环驱动全链路自进化。目前已在企业知识库场景完成 10+ 异构数据源的统一接入与落地验证。


演讲提纲:

一、背景与架构全景
1. Agent 时代的检索范式变化
- 传统检索的三大失效点:单轮查询无法满足多步推理、静态索引滞后于业务变化、割裂的数据源导致上下文碎片化
- 四代检索演进:从关键词检索到语义检索、混合检索、再到 Agentic Search
2. ContextSearch 的核心判断与架构设计
- 核心判断:Agent 的上下文层必须同时满足可协同、可治理、可进化
- 三层架构全景:Agentic 导入层、Agent Search 层、Context 治理层
- 迭代闭环:导入、检索、治理形成持续进化的飞轮


二、Agentic 导入:从天级到小时级的数据就绪
1. 多源异构数据的统一建模
- 覆盖文档、代码、数据库、API 等 10+ 数据源类型
- 元信息自动提取与结构化标注
2. Code Agent 自动生成 Pipeline
- 基于 LLM 的 Pipeline 自动编排:用户描述需求,Agent 自动生成导入流水线
- MQ 解耦的弹性流水线架构,支持动态扩缩容
- 实测效果:数据导入周期从天级压缩至小时级


三、Agentic Search:从查询到多步推理
1. 核心链路设计
- Planner 意图拆解:将复杂查询分解为可执行的子任务
- Agent Factory 动态编排:根据数据源特征按需实例化 Sub-Agent
- Sub-Agent 执行层:基于 ReAct 范式的检索-推理循环
- 自评估与重规划:结果不满足置信度阈值时自动触发重规划
2. 检索底座能力
- 多源联邦检索:Fusion Ranker 实现跨数据源统一排序
- 混合检索策略:BM25 精确匹配与 Dense Vector 语义召回融合
- RaBitQ + DiskANN 向量引擎:1-bit 量化 + 磁盘驻留图索引,百亿规模下 P99 延迟降低 72.3%、QPS 提升 450%、存储成本下降 83.5%


四、效果优化与治理闭环
1. 反馈驱动的自进化机制
- 显式反馈:用户评价、标注数据回流至检索模型与排序策略
- 隐式反馈:点击率、停留时长、引用率等行为信号自动采集与分析
- 闭环调优:反馈信号驱动 Query 改写、召回策略、排序权重的持续迭代
2. 导入-检索-治理迭代闭环
- 数据质量信号反哺导入层,优化数据清洗与切片策略
- 检索效果指标驱动索引结构与模型的自动调优
- 治理层统筹全链路可观测性,形成持续进化飞轮


五、实战验证与未来展望
1. 企业知识库落地实践
- 10+ 异构数据源统一接入,覆盖文档、代码、数据库、API 等多种类型
- 导入效率、检索精度、端到端响应时延等关键指标改善效果
- 典型业务场景下的效果验证与用户反馈
2. 与业界主流方案的思路差异
- 从"检索工具库"到"端到端上下文平台"的路线差异
- 闭环自进化能力带来的长期价值
3. Context Engineering 展望
- 从检索工具到上下文工程平台的演进方向
- Agent 生态中上下文层的未来形态


六、总结


听众收益:

1. 掌握 Agentic Search 的工程化落地方法:了解如何将 Planner-SubAgent-自评估链路从概念转化为可上线的检索系统,获得多源联邦检索与混合检索的实战组合策略,以及 RaBitQ+DiskANN 在百亿规模下的性价比优化经验。
2. 获得 Agent 上下文平台的端到端建设思路:从 Agentic 导入、Agent Search 到治理闭环,理解如何构建一个可持续进化的上下文层,而非拼装离散的检索工具,为自身团队的 Agent 基础设施选型与架构设计提供参考。
3. 借鉴反馈闭环驱动自进化的实践经验:了解显式与隐式反馈信号如何驱动检索链路的自动调优,避免"上线即终态"的常见陷阱,学习如何让系统在生产环境中持续迭代优化。

04 月 24 日 14:55 - 15:40