AM
专题网页
Agent Memory
6. Memory Objectives

记忆服务于什么

同样都叫 memory,不同 agent 想解决的问题可能完全不同。目标不先说清楚,前面所有设计都容易做散。

Personalization、Continuity、Task Execution、Skill Evolution 是最常见的四类目标。这一页不是再讲一种新技术,而是把前面几章重新拉回到一个更实际的问题上:你到底想让这套记忆帮你变强在哪。

Plain Explanation

这一页不是在讲“怎么记”,而是在讲“为什么记”。有的系统记忆是为了记住用户偏好,有的是为了跨会话接上进度,有的是为了更稳地完成任务,还有的是为了积累做事经验。

When To Use
  • 当你觉得什么都想做、却不知道 memory 应该优先优化哪一块时,先回到这一页。
  • 当不同团队对 memory 的期待不一致时,需要先统一服务目标。
  • 当技术方案已经很多,但不知道该用什么指标评估时,目标页能帮助你重新聚焦。
Design Questions
  • 系统是为了记住用户、记住任务,还是记住做事经验?
  • 更重视稳定 profile、上下文连续,还是工具执行反馈?
  • memory 是服务单个用户,还是多 agent / 团队级协作?
Evaluation Metrics
个性化信息命中得准不准,profile 改得对不对
跨会话时,能不能自然接上上次进度
任务完成率高不高,状态断了之后能不能接回来
沉淀下来的经验,后面有没有真的被复用起来
Mainstream Mechanisms

先抓住这一页真正主流的机制主线

这一组不是“所有相关概念”,而是这个维度最核心、最值得先理解的主线。带下划线的机制可以直接点开,会弹出一个更细的解释窗。

Pipeline

把这些机制放回一条工作流里看

如果只看孤立卡片,机制之间的关系会很模糊。把它们放回 pipeline 中,就能看清每一步在系统里承担什么角色,以及问题通常出在什么位置。

1

Choose Objective

先明确系统主目标,而不是默认“都要”。

2

Map Layers

将目标映射到短期、长期、工作和经验记忆层。

3

Prioritize

决定预算、写入和检索策略优先服务谁。

4

Evaluate

按目标定义专属指标,而非只看统一 recall。

Mechanisms

扩展机制与细部取舍

User profile

Personalization

围绕偏好、身份、语气和长期约束建立稳定用户画像。

Strengths

提升连续感与定制化体验。

Risks

最容易涉及隐私、过期偏好和误归因。

Best Fit

陪伴型助手、客服、办公 copilot。

Cross-session

Continuity

保证多次会话之间能接上文,记住上次做到哪里、结论是什么。

State + constraints

Task Execution

把计划、环境状态、工具输出和约束组织成执行型记忆。

Experience -> procedure

Skill Evolution

从成功/失败轨迹中提炼可复用方法、策略与技能模块。

Examples

把这一章放进真实场景里看

陪伴型助手 vs 任务型 agent

陪伴型助手最需要记住的是用户偏好和长期语气;任务型 agent 更需要记住当前计划、状态和错误恢复点。

Takeaway: 同样都叫 memory,不同目标下的最优设计差别很大。

经验型系统的目标错位

团队口头上说想做会自我改进的 agent,但实际指标只看问答命中率。结果 memory 系统永远在优化检索,而不是经验沉淀。

Takeaway: 目标不落到指标上,前面所有设计最后都会跑偏。
Architecture Notes

从系统设计角度看这个维度

这一部分补充的是更偏 memory system design 的视角:不只看概念本身,而是看这些机制在真实系统里应该放在哪一层、如何被组织、如何被观测。

服务目标应该能映射到具体 memory architecture:比如 personalization 更偏 profile layer,task execution 更偏 state layer,skill evolution 更偏 experience layer。
成熟系统通常不止一种目标,但最好有清楚的主目标和次目标,不然预算和精力很容易分散。
评估时也要按目标拆指标,别拿一个统一 recall 去评价完全不同类型的记忆系统。
Misconceptions

这一章最容易被误解的地方

误解一:先把技术方案做全,再慢慢决定 memory 是为谁服务。
误解二:所有 memory 系统都可以用一套统一指标来评价。
误解三:目标页只是总结性章节,对前面架构设计影响不大。
Deep Dive

展开理解这个维度

目标为什么是第一性问题

如果先聊技术、后聊目标,最后很容易得到一套“什么都沾一点,但没有一项做深”的系统。目标页的作用,就是把前面所有设计拉回到“到底为什么而做”。

  • 个性化需要稳定 profile 和记忆更新准确性。
  • 连续性需要跨会话摘要和任务延续能力。
  • 执行型任务更依赖 working memory 和状态组织。

不同目标会反向塑造前五个维度

目标不是最后附在结尾的一段总结,它会反过来决定短期、长期、写入和治理这些层到底该怎么搭。

  • Personalization 会偏向结构化 profile 和记忆修正机制。
  • Task Execution 会偏向强 working memory 和约束槽位。
  • Skill Evolution 会偏向 consolidation 与经验提炼。

如何判断目标是否明确

一个最直接的判断方法是问自己:如果 memory 做好了,你最希望哪项能力明显提升?如果答不出来,说明目标还没有想清楚。

  • 如果答案总是“都要”,说明系统目标还不够聚焦。
  • 如果你无法定义成功指标,说明目标还没落到设计层。
  • 一个清晰目标应该能映射到清晰的写入、检索与治理策略。

目标页为什么还要关心评估

目标如果落不到指标上,就还只是口号。不同目标需要不同评价方式,不能拿一个统一 recall 分数去评价所有 memory 系统。

  • Personalization 更看长期偏好命中与纠错能力。
  • Continuity 更看跨会话接续是否自然、是否少重复澄清。
  • Task Execution 更看任务完成率、状态恢复率和错误恢复能力。
  • Skill Evolution 更看经验是否被复用,以及复用后是否真的提升了表现。

用更通俗的话说,目标页像什么

前面几章讲的是“怎么搭引擎、变速箱、刹车和仪表盘”,目标页讲的是“这辆车到底要拿来跑什么路”。不同用途,会反过来决定整车怎么调。

  • 如果是陪伴型助手,更关注个性化和连续感。
  • 如果是任务型 agent,更关注状态延续和执行稳定性。
  • 如果是自改进 agent,更关注经验沉淀和技能复用。
Failure Modes

常见失败模式

系统试图同时优化所有目标,结果没有一个目标做深
目标偏个性化,却把大量预算花在任务日志和过程噪声上
目标偏 skill evolution,却没有经验抽取与复用闭环
Previous Chapter
5. Memory Hygiene

如何避免记忆污染

看长期运行后记忆是否还能保持可信

Next Chapter
7. Agent Memory Global Map

从全局角度看,memory 机制是怎么分工的

看 memory 机制作为整体时如何分层、分工与组合