8. Agent Memory Patterns

按 agent 类型看，memory 组合为什么会不一样

同样都在做 memory，不同 agent 真正在解决的问题其实很不一样，所以最后长出来的 memory 组合也不会一样。真正值得比较的，不只是“用了什么库”，而是它到底想记住什么、最怕忘掉什么、以及愿意为此付出多少复杂度和成本。

这一章承接上一章的全局机制地图，不再从“机制层怎么分工”出发，而是从“不同 agent 为什么会偏不同组合”出发。常见差异可以先从 5 类典型形态看出来：聊天陪伴型、知识问答型、任务执行型、项目协作型、自我改进型。它们关注的记忆对象、常用机制、主要优势、典型代价和失败方式都不一样。

Plain Explanation

可以把这一章理解成“选型地图”。前面 6 章讲的是零件，这一章讲的是不同类型的车为什么会装不同的零件。不是所有 agent 都需要很重的长期记忆，也不是所有 agent 都值得上复杂的经验沉淀。很多时候，真正该问的不是“什么最先进”，而是“我的 agent 到底最怕忘掉什么”。

When To Use

当你已经知道各种 memory 机制，但还不知道该怎么给自己的 agent 选型时，这一章最有用。
当团队在讨论“为什么别人要上图谱、我们却不一定要上”时，可以用这一章统一预期。
当你想比较不同 agent 的 memory 优缺点，而不是只比较某一个技术组件时，可以从这里收束。
当你发现自己什么都想加一点时，这一章也能帮你判断哪些能力真的是当前阶段必须的。

Design Questions

这个 agent 最怕忘掉的是用户偏好、知识资料、任务状态，还是做事经验？
它更需要“记得像同一个人”，还是“做事更稳、更能续上进度”？
它的 memory 问题更像检索问题、状态管理问题，还是经验抽取问题？
如果只允许你先做好一层 memory，最应该先补的是哪一层？
这个 agent 当前阶段真的需要复杂 memory，还是先把 prompt 和 workflow 做稳更重要？

Evaluation Metrics

陪伴型：偏好命中准不准、误记多不多

知识型：相关资料找回率高不高、引用靠不靠谱

任务型：长流程完成率和中断恢复能力怎么样

项目型：跨会话续接自然不自然、重复解释多不多

学习型：经验有没有复用，复用后效果有没有真的变好

混合型：多层 memory 一起工作时，收益有没有真的大于复杂度

Mainstream Mechanisms

先抓住这一页真正主流的机制主线

这一组不是“所有相关概念”，而是这个维度最核心、最值得先理解的主线。带下划线的机制可以直接点开，会弹出一个更细的解释窗。

1. Companion / Personal Assistant Pattern

2. Knowledge Retrieval Pattern

3. Workflow / Tool-use Pattern

4. Project / Continuity Pattern

5. Learning / Skill Evolution Pattern

6. Hybrid Platform Pattern

Pipeline

把这些机制放回一条工作流里看

如果只看孤立卡片，机制之间的关系会很模糊。把它们放回 pipeline 中，就能看清每一步在系统里承担什么角色，以及问题通常出在什么位置。

Identify Agent Type

先判断这个 agent 最主要在服务什么场景，而不是先选数据库。

Map Memory Priorities

看它更依赖短期记忆、长期记忆、工作记忆，还是经验沉淀。

Choose Mechanism Mix

根据场景选择 Buffer、Vector、State Store、Graph、Consolidation 等组合。

Accept Tradeoffs

每种组合都有代价：成本、复杂度、污染风险、延迟或维护负担。

Check Failure Mode

提前看清它最容易翻车的地方，是误记、漏记、串味、丢状态还是学歪。

Evaluate by Goal

最后用这个 agent 真正在乎的指标来判断记忆方案好不好。

Mechanisms

扩展机制与细部取舍

Profile-heavy

聊天陪伴型 / Personal Assistant

这类 agent 最看重用户画像、长期偏好、语气习惯和连续陪伴感，通常会把结构化 profile 和记忆更新放在前面。

Strengths

个性化效果明显，用户会感到“它记得我是谁、我喜欢什么”。

Risks

最容易记错偏好、把临时要求当长期设定，也最容易碰到隐私和过期问题。

Best Fit

陪伴助手、客服、办公助理、个人 Copilot。

Retrieval-heavy

知识问答型 / Retrieval Agent

这类 agent 主要靠长期知识检索吃饭，核心常是 chunking、embedding、vector search、reranking 和 citation。

Working-memory-heavy

任务执行型 / Workflow Agent

这类 agent 更依赖工作记忆和状态编排。它最怕的不是忘了用户爱好，而是忘了当前计划、约束、工具输出和恢复点。

State + continuity

项目协作型 / Continuity Agent

这类 agent 要跨会话、跨天甚至跨周接着做同一件事，所以很依赖任务状态、阶段结论、决策记录和作用域隔离。

Experience-heavy

自我改进型 / Learning Agent

这类 agent 不只想记住人和事，还想从成功与失败中提炼经验、策略甚至技能模块。

Layered mix

平台混合型 / Hybrid Platform

这类系统往往不是单一 agent，而是一个平台里同时存在问答、协作、执行和个性化能力，所以 memory 往往是分层混合搭建的。

Examples

把这一章放进真实场景里看

为什么聊天助手和 coding agent 的 memory 看起来像两套系统

聊天助手最关心的是“这个用户一直喜欢什么口吻、讨厌什么表达”，而 coding agent 更关心“刚才跑了哪些命令、失败在哪一步、下一步该修哪里”。两者都叫 memory，但真正要保的内容完全不同。

Takeaway: 比较 agent memory 时，先看它最怕忘掉什么，再看它用了什么机制。

为什么有些 agent 很依赖向量库，有些却更像状态机

文档问答系统面对的是海量知识块，核心问题是怎么找回相关资料；而工作流 agent 面对的是步骤、计划、约束和工具输出，核心问题常常是怎么把当前状态编排好。

Takeaway: 不是所有 agent 的 memory 问题都等于检索问题。

为什么很多真实产品最后都会变成混合型

一个企业助手一开始也许只是知识问答，但做着做着，团队会希望它记住用户偏好、延续项目进度、执行流程任务，甚至复用历史经验。于是 memory 结构会从单一路径慢慢长成多层组合。

Takeaway: 真实系统经常不是“只属于一种类型”，而是有一个主类型，再叠加一到两个次能力。

为什么“最先进的 memory”不一定是最好的

一个刚起步的客服助手，如果上来就做经验提炼、图谱构建、多层混合存储，可能还不如先把用户偏好、作用域隔离和最近上下文做好。

Takeaway: memory 方案不是越重越好，而是越贴近当前产品阶段越好。

Architecture Notes

从系统设计角度看这个维度

这一部分补充的是更偏 memory system design 的视角：不只看概念本身，而是看这些机制在真实系统里应该放在哪一层、如何被组织、如何被观测。

比较不同 agent 的 memory，最好先按目标和工作流分组，而不是直接按产品名罗列。

陪伴型 agent 往往更依赖 profile layer，任务型 agent 更依赖 state layer，知识型 agent 更依赖 retrieval layer，学习型 agent 更依赖 experience layer。

真正成熟的系统常常是混合型的，只是每一类 agent 的主重心不同。

平台型系统尤其要先定义主数据边界，不然 profile、state、knowledge、experience 会越做越缠。

总结章真正的价值，不是告诉你哪种 agent 最先进，而是帮你判断现在这一步最该补哪种记忆能力。

Misconceptions

这一章最容易被误解的地方

误解一：不同 agent 的 memory 差别，主要只是选了不同数据库。

误解二：只要把长期记忆做强，所有 agent 都会同步变强。

误解三：先进的 agent 一定要做经验沉淀和自我改进。

误解四：别人用了图谱、向量库、反思机制，我们也应该一次全上。

Deep Dive

展开理解这个维度

为什么不同 agent 会长出不同记忆结构

因为它们要解决的问题不一样。陪伴型 agent 最在意的是“记住你”，知识型 agent 最在意的是“找对资料”，任务型 agent 最在意的是“别把当前状态搞丢”，学习型 agent 最在意的是“下次能不能做得更好”。

目标不同，决定了写什么、怎么检索、什么该优先进入 prompt。
所以 memory architecture 不是一个标准件，而更像是围绕任务长出来的结构。
同样一套机制，换个场景，收益和代价都可能变掉。

最常见的五种 agent memory 偏好

如果用最直白的话来总结：陪伴型偏 profile，知识型偏 retrieval，任务型偏 working memory，项目型偏 continuity，学习型偏经验沉淀。

陪伴型最怕不懂你，所以更重 personalization。
知识型最怕找不到资料，所以更重长期检索链路。
任务型最怕步骤断线，所以更重状态和上下文编排。
学习型最怕重复踩坑，所以更重经验抽取与复用。

把 5 类 agent 放在同一张比较表里看，会看到什么

如果把这几类 agent 摆在一起比较，会发现它们差别最大的地方，往往不是“存在哪”，而是“记什么、怎么取、怎么用、出错后会伤到哪”。

陪伴型最重 profile 和记忆修正，优点是有连续感，缺点是容易误记和过期。
知识型最重检索链路，优点是能接大量外部资料，缺点是很吃 chunking、排序和来源质量。
任务型最重 working memory 和状态组织，优点是执行稳定，缺点是日志和状态容易混杂。
项目型最重 continuity 和作用域，优点是能少重复沟通，缺点是错误状态会被带着往后跑。
学习型最重经验抽取，优点是长期上限高，缺点是最难证明自己真的学会了。

它们各自的优点和代价

没有哪种 agent 的 memory 方案是纯赚不赔的。每一种强项背后，通常都带着对应的成本和风险。

陪伴型更有人味，但也更容易碰上隐私、偏好过期和误记问题。
知识型扩展性强，但很吃 chunking、排序和来源质量。
任务型执行更稳，但系统日志和状态管理会变复杂。
学习型上限高，但最难做对，也最难评估是否真的学会了。

什么叫主类型，什么叫次能力

真实产品很少只属于一种类型。更常见的情况是：它有一个最主要的定位，再叠加少量次能力。比如项目助手可能主要是 continuity agent，但会带一点 retrieval；coding agent 主要是 workflow agent，但会带一点 skill evolution。

先找主类型，能帮你决定 memory 的第一优先级。
再看次能力，决定你要不要补第二层和第三层。
这样做的好处是不会一上来就把系统做成一锅炖。

怎么用这一章做选型

最简单的方法不是先看别人用了什么，而是先回答三个问题：你最想让 agent 记住什么、最怕它忘掉什么、最能接受哪种代价。

如果最怕忘掉用户习惯，就优先做好 profile 和记忆修正。
如果最怕找不到旧资料，就优先补强长期检索链路。
如果最怕任务半路断线，就优先补 working memory 和状态恢复。

什么时候不要把 memory 做得太重

很多团队会把 memory 当成万能补药，但其实有些问题不是 memory 弱，而是 prompt、工具接口、任务拆解或系统边界本身还没做好。这个时候上很重的 memory，只会让系统更难调。

如果单轮任务都还不稳，先别急着做复杂长期记忆。
如果用户几乎不会跨会话回来，continuity 的收益可能没有想象中高。
如果任务高度结构化，先把状态管理和流程控制做好，往往比做重语义记忆更划算。

一个更实用的落地顺序

如果你是从零开始做一个 agent，通常不需要一步做到最复杂。更实用的顺序是先做最会立刻带来收益的那一层，再按问题暴露的方向逐步补齐。

第一步：先把短期记忆和工作记忆做好，让当前回合别乱。
第二步：再补长期检索或 profile，让系统开始具备跨会话价值。
第三步：等写入和污染问题真的出现，再补治理、版本和衰减。
第四步：只有当你真的需要复用经验时，再上 consolidation 和 skill evolution。

用更通俗的话说，这一章像什么

前面几章像是在讲发动机、底盘、变速箱、刹车分别怎么选，这一章像是在讲：家用车、货车、越野车、赛车，为什么不会用同一套配置。

不是谁零件多谁就一定好。
关键是这套 memory 配置和它要跑的路配不配。
比较优缺点时，要把使用场景一起带上看。

Failure Modes

常见失败模式

把所有 agent 都当成同一种 memory 问题来设计，结果方案既重又散

明明是任务型 agent，却把大部分精力花在用户偏好长期存储上

明明想做学习型 agent，却没有经验提炼、验证和回滚机制

只看别人用了什么组件，不看那个组件为什么适合那个 agent

没有主类型判断，结果所有层都做了一点，但没有一层真正好用

还没把当前回合做稳，就急着上很重的长期记忆，最后越改越乱

Previous Chapter

7. Agent Memory Global Map

从全局角度看，memory 机制是怎么分工的

看 memory 机制作为整体时如何分层、分工与组合

←

Next Chapter

已经是最后一章

你已经读到最后一章了，可以回总览重新跳读，或者继续回看前面的章节。