6. Memory Objectives

记忆服务于什么

同样都叫 memory，不同 agent 想解决的问题可能完全不同。目标不先说清楚，前面所有设计都容易做散。

Personalization、Continuity、Task Execution、Skill Evolution 是最常见的四类目标。这一页不是再讲一种新技术，而是把前面几章重新拉回到一个更实际的问题上：你到底想让这套记忆帮你变强在哪。

Plain Explanation

这一页不是在讲“怎么记”，而是在讲“为什么记”。有的系统记忆是为了记住用户偏好，有的是为了跨会话接上进度，有的是为了更稳地完成任务，还有的是为了积累做事经验。

When To Use

当你觉得什么都想做、却不知道 memory 应该优先优化哪一块时，先回到这一页。
当不同团队对 memory 的期待不一致时，需要先统一服务目标。
当技术方案已经很多，但不知道该用什么指标评估时，目标页能帮助你重新聚焦。

Design Questions

系统是为了记住用户、记住任务，还是记住做事经验？
更重视稳定 profile、上下文连续，还是工具执行反馈？
memory 是服务单个用户，还是多 agent / 团队级协作？

Evaluation Metrics

个性化信息命中得准不准，profile 改得对不对

跨会话时，能不能自然接上上次进度

任务完成率高不高，状态断了之后能不能接回来

沉淀下来的经验，后面有没有真的被复用起来

Mainstream Mechanisms

先抓住这一页真正主流的机制主线

这一组不是“所有相关概念”，而是这个维度最核心、最值得先理解的主线。带下划线的机制可以直接点开，会弹出一个更细的解释窗。

Pipeline

把这些机制放回一条工作流里看

如果只看孤立卡片，机制之间的关系会很模糊。把它们放回 pipeline 中，就能看清每一步在系统里承担什么角色，以及问题通常出在什么位置。

Choose Objective

先明确系统主目标，而不是默认“都要”。

Map Layers

将目标映射到短期、长期、工作和经验记忆层。

Prioritize

决定预算、写入和检索策略优先服务谁。

Evaluate

按目标定义专属指标，而非只看统一 recall。

Mechanisms

扩展机制与细部取舍

User profile

Personalization

围绕偏好、身份、语气和长期约束建立稳定用户画像。

Strengths

提升连续感与定制化体验。

Risks

最容易涉及隐私、过期偏好和误归因。

Best Fit

陪伴型助手、客服、办公 copilot。

Cross-session

Continuity

保证多次会话之间能接上文，记住上次做到哪里、结论是什么。

State + constraints

Task Execution

把计划、环境状态、工具输出和约束组织成执行型记忆。

Experience -> procedure

Skill Evolution

从成功/失败轨迹中提炼可复用方法、策略与技能模块。

Examples

把这一章放进真实场景里看

陪伴型助手 vs 任务型 agent

陪伴型助手最需要记住的是用户偏好和长期语气；任务型 agent 更需要记住当前计划、状态和错误恢复点。

Takeaway: 同样都叫 memory，不同目标下的最优设计差别很大。

经验型系统的目标错位

团队口头上说想做会自我改进的 agent，但实际指标只看问答命中率。结果 memory 系统永远在优化检索，而不是经验沉淀。

Takeaway: 目标不落到指标上，前面所有设计最后都会跑偏。

Architecture Notes

从系统设计角度看这个维度

这一部分补充的是更偏 memory system design 的视角：不只看概念本身，而是看这些机制在真实系统里应该放在哪一层、如何被组织、如何被观测。

服务目标应该能映射到具体 memory architecture：比如 personalization 更偏 profile layer，task execution 更偏 state layer，skill evolution 更偏 experience layer。

成熟系统通常不止一种目标，但最好有清楚的主目标和次目标，不然预算和精力很容易分散。

评估时也要按目标拆指标，别拿一个统一 recall 去评价完全不同类型的记忆系统。

Misconceptions

这一章最容易被误解的地方

误解一：先把技术方案做全，再慢慢决定 memory 是为谁服务。

误解二：所有 memory 系统都可以用一套统一指标来评价。

误解三：目标页只是总结性章节，对前面架构设计影响不大。

Deep Dive

展开理解这个维度

目标为什么是第一性问题

如果先聊技术、后聊目标，最后很容易得到一套“什么都沾一点，但没有一项做深”的系统。目标页的作用，就是把前面所有设计拉回到“到底为什么而做”。

个性化需要稳定 profile 和记忆更新准确性。
连续性需要跨会话摘要和任务延续能力。
执行型任务更依赖 working memory 和状态组织。

不同目标会反向塑造前五个维度

目标不是最后附在结尾的一段总结，它会反过来决定短期、长期、写入和治理这些层到底该怎么搭。

Personalization 会偏向结构化 profile 和记忆修正机制。
Task Execution 会偏向强 working memory 和约束槽位。
Skill Evolution 会偏向 consolidation 与经验提炼。

如何判断目标是否明确

一个最直接的判断方法是问自己：如果 memory 做好了，你最希望哪项能力明显提升？如果答不出来，说明目标还没有想清楚。

如果答案总是“都要”，说明系统目标还不够聚焦。
如果你无法定义成功指标，说明目标还没落到设计层。
一个清晰目标应该能映射到清晰的写入、检索与治理策略。

目标页为什么还要关心评估

目标如果落不到指标上，就还只是口号。不同目标需要不同评价方式，不能拿一个统一 recall 分数去评价所有 memory 系统。

Personalization 更看长期偏好命中与纠错能力。
Continuity 更看跨会话接续是否自然、是否少重复澄清。
Task Execution 更看任务完成率、状态恢复率和错误恢复能力。
Skill Evolution 更看经验是否被复用，以及复用后是否真的提升了表现。

用更通俗的话说，目标页像什么

前面几章讲的是“怎么搭引擎、变速箱、刹车和仪表盘”，目标页讲的是“这辆车到底要拿来跑什么路”。不同用途，会反过来决定整车怎么调。

如果是陪伴型助手，更关注个性化和连续感。
如果是任务型 agent，更关注状态延续和执行稳定性。
如果是自改进 agent，更关注经验沉淀和技能复用。

Failure Modes

常见失败模式

系统试图同时优化所有目标，结果没有一个目标做深

目标偏个性化，却把大量预算花在任务日志和过程噪声上

目标偏 skill evolution，却没有经验抽取与复用闭环

Previous Chapter

5. Memory Hygiene

如何避免记忆污染

看长期运行后记忆是否还能保持可信

←

Next Chapter

7. Agent Memory Global Map

从全局角度看，memory 机制是怎么分工的

看 memory 机制作为整体时如何分层、分工与组合

→