面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进
个人数字记忆碎片化是终端Agent面临的核心挑战。本次演讲分享OPPO如何构建一个面向手机Agent的记忆系统,以解决“记不起、找不到”的用户痛点。我们将深入探讨这一系统的三大核心支柱:
1. 记忆机制设计:如何为手机Agent设计端云融合的分层记忆机制,实现从瞬时感知到长期记忆的协同运作。
2. 知识增强策略:为何我们选择Agentic-RAG作为主架构,并巧妙融合轻量微调,以在成本、时效性和隐私间取得最佳平衡。
3. 上下文管理与成本优化:如何通过动态上下文压缩与窗口管理策略,在保证95%问题准确性的同时,将端侧响应时延压缩到极致。
我将以已商用OPPO手机AI搜索为例,分享在召准F1=83.9% 的背后,我们在模型选型、工程架构上的权衡、痛点与前沿思考。
演讲提纲:
一、引言:手机作为个人数字记忆体——Agent记忆工程的机遇与挑战
二、核心架构:面向手机Agent的记忆系统设计
三、实战:高精度、低时延记忆检索的工程实现
四、未来演进:更智能、更经济的Agent记忆
听众收益:
1. 获得一套经过大规模用户验证的、端云融合的Agent记忆机制设计蓝图。
2. 深入理解“RAG vs. 微调”在终端场景下的决策权衡与混合实践,而仅是理论对比。
3. 掌握一套可落地的上下文压缩与窗口管理策略,直接用于解决长上下文带来的成本与延迟问题。
4. 学习如何将大模型的智能与确定性工程逻辑结合,构建稳定、可靠的商用AI产品。
之前曾参与百度小度音箱项目的开发上线工作,加入OPPO后负责过OPPO视频字幕业务上线及优化实施,目前负责OPPO AI搜索业务落地上线及优化工作。