如何让 Agent 真正记得住:基础模型视角下的 Agent 长期记忆工程
主要从基础模型和应用双重角度下,讨论memory的定义、重要性以及当前的痛点,包括获取完整记忆难,评价难等问题。对比 RAG 与 model-based 两类方案,分析当前各个方案的优劣性。并提出一套实践方案,结合RAG与模型的Hybrid Memory 实践路径,围绕“获取‑组织‑利用”搭建记忆工作流,按场景定义指标,并联合调优模型与 PPL,构建记忆评价与数据飞轮;在内部试点中用户使用黏性有明显的提升。最后针对当前的技术、隐私、体验等瓶颈进行分析,并对未来技术进行展望。
演讲提纲:
一、为什么Memory如此重要和痛点分析
1. Memory定义
2. 模型记忆:从基模角度如何看待memory(长期记忆对于技术突破的重要性)
3. 产品记忆:从应用角度Memory的重要性
4. 当前Memory技术存在哪些痛点
a. Context 获取困难拿不到“完整上下文”
b. Long Context 不知道如何评价
2. Memory 实现的基础方案
a. 介绍 RAG 方案及优劣势
b. 介绍 Model-based 方案及优劣势
3. Memory 业务实践流程(基础模型侧可以多做哪几件事,构建记忆评价与数据飞轮)
a. 定义场景和优化目标以及评测方式指标
b. Hybrid 方案方案及优劣势
c. 搭建工作流
d. 模型和PPL 端到端调优(在预训练/后训练阶段刻意优化让记忆更好用)
4. 当前瓶颈和未来展望
a. 当前瓶颈与落地挑战(包括技术、隐私、体验挑战等)
b. 未来展望(从长期记忆到到多智能体社会)
听众收益:
- 角度层面:介绍在“基础模型视角”下,Agent 记忆能力是如何被拆解为短期上下文、长期用户记忆和语义知识三层,以及模型能力与系统工程的清晰分工;
- 工程层面:有一套可落地的记忆工程方法论。学会用「获取‑组织‑利用」三板斧设计记忆模块,知道记忆与 RAG 的本质区别,如何设计写入、遗忘和调用策略;
- 评估与增长层面:利用数据飞轮优化记忆能力。了解如何设计评价指标,并通过数据循环进行效果优化。
毕业于清华大学,资深AI技术专家。深耕计算机视觉、AI芯片及自动驾驶多年,2023年加入阶跃星程,负责大模型的技术研发工作,主导Step-Audio等项目,目前为Agent研发负责人,具备从底层硬件优化到上层Agent架构的全栈开发经验。累计获得50+项专利,在国际顶会发表多篇论文,擅长解决前沿领域的复杂算法及工程挑战。