AM
专题网页
Agent Memory
4. Write Policy

何时写入长期记忆

长期记忆第一关不是怎么查,而是什么时候该写进去。什么值得记、什么时候记、记成什么样,基本决定了后面检索质量的上限。

靠谱的 memory 系统通常不会每轮都写,而是会用规则、重要性评分、事件触发或 consolidation 来筛一遍,只有真正值得长期保留的内容才进库。

Plain Explanation

写入策略就像代理的“记事规则”。不是每句话都值得长期记住,也不是所有重要信息都该立刻入库。写入策略做的事,就是决定什么该记、什么时候记、用什么形式记。

When To Use
  • 当长期记忆越来越大、但召回质量越来越差时,通常要先检查写入策略。
  • 当系统容易把一次性的临时要求当成长期偏好时,说明写入门槛太低。
  • 当你开始关心 memory quality,而不只是 memory quantity 时,就必须设计写入策略。
Design Questions
  • 每轮都写,还是只在关键事件和任务收束时写?
  • 是存原文、存摘要、存事实,还是存关系与经验?
  • 写入决策由规则控制、LLM 决定,还是混合策略?
Evaluation Metrics
写进去的新内容里,有多少其实是重复或噪声
真正重要的信息,有没有被漏掉
新写入的长期记忆,后面到底有没有被再次用到
不同写入策略会额外增加多少 token 和延迟成本
Mainstream Mechanisms

先抓住这一页真正主流的机制主线

这一组不是“所有相关概念”,而是这个维度最核心、最值得先理解的主线。带下划线的机制可以直接点开,会弹出一个更细的解释窗。

3. Importance-gated Write
4. Extract-then-Write
Pipeline

把这些机制放回一条工作流里看

如果只看孤立卡片,机制之间的关系会很模糊。把它们放回 pipeline 中,就能看清每一步在系统里承担什么角色,以及问题通常出在什么位置。

1

Observe

识别当前回合或任务中可能值得长期保存的信息。

2

Score

依据规则、事件或重要性评估是否值得持久化。

3

Normalize

决定以原文、摘要、事实、关系还是经验形式写入。

4

Persist

将筛选后的记忆写入长期层并附上 metadata。

5

Consolidate

在后处理阶段进一步整合成更稳定的长期表示。

Mechanisms

扩展机制与细部取舍

Append everything

Always Write

每轮交互都写入长期层,最简单但风险最高。

Strengths

实现快,不容易漏掉可能重要的信息。

Risks

噪声、瞬时需求和错误信息会一起沉淀。

Best Fit

仅适合实验阶段或小规模研究环境。

Rule-based gate

Event-triggered Write

在用户偏好、任务完成、状态变化等关键事件发生时再写入。

Scored persistence

Importance-based Write

先评估记忆的重要性,再决定是否持久化。

Extract then persist

Consolidated Write

先把多轮交互整理为事实、关系或经验,再写入长期层。

Examples

把这一章放进真实场景里看

临时需求被误记成长期偏好

用户今天说“这次请用正式语气写”,系统如果直接把这句话写成长期偏好,下次所有回复都变得过度正式。

Takeaway: 写入策略要能区分“这一轮有效”与“长期有效”。

任务完成后的经验沉淀

代理多次完成同类排障任务后,把原始过程整理成一条稳定经验,再写入长期层,后续就不必每次都从头探索。

Takeaway: 好的写入策略不仅决定记不记,还决定记成什么形态更有价值。
Architecture Notes

从系统设计角度看这个维度

这一部分补充的是更偏 memory system design 的视角:不只看概念本身,而是看这些机制在真实系统里应该放在哪一层、如何被组织、如何被观测。

写入策略最好单独做成一条 memory ingestion pipeline,而不是散落在业务代码里临时拼出来。
更稳的系统会把 extraction、scoring、normalization、persist 分成几个能看见、能排查的步骤。
如果后面还要做 consolidation,写入时就得顺手把足够的 metadata 留好,方便回溯和重整。
Misconceptions

这一章最容易被误解的地方

误解一:写得越多,长期记忆就越聪明。
误解二:只要有打分模型,写入策略就自动合理。
误解三:consolidation 一定会提升质量,实际上也可能把原始经验改坏。
Deep Dive

展开理解这个维度

写入策略为什么是 memory 质量的第一关

长期记忆一旦写进去,后面每次检索、排序和推理都有可能再次用到它。所以写入阶段出错,不是只错一次,而是可能被反复放大。

  • 存得太多,长期层会被碎片和幻觉淹没。
  • 存得太少,系统又无法真正形成跨会话连续性。
  • 所以写入策略的核心不是多写,而是有选择地写。

写入粒度决定后续检索方式

你今天决定怎么写进去,明天系统就只能按这种形态把它找回来。存原文、存摘要、存事实、存关系,其实是在提前决定未来怎么检索、怎么用。

  • 原文适合保真,但会增加冗余和检索噪声。
  • 事实与关系便于整理,但需要抽取和版本化。
  • 经验和技能更有迁移价值,但提炼难度最高。

一个实用的写入设计顺序

很多团队一开始就急着讨论要不要上向量库,反而忘了先回答“哪些东西值得记”。更稳的做法,是先想目标,再倒推写入策略。

  • 如果服务个性化,就优先定义哪些偏好值得长期保存。
  • 如果服务任务执行,就优先定义哪些状态需要跨回合延续。
  • 如果服务 skill 演化,就优先定义哪些成功/失败轨迹值得提炼。

为什么“先保留原始经历,再谨慎 consolidation”越来越重要

近来的研究开始提醒一个问题:把经历总结成长期结论,不一定总是赚的。有时候 consolidation 会把原本有用的经验改写坏。换句话说,摘要不是天然更高级,它也可能丢掉关键证据。

  • Raw episodes 像原始案卷,保真但杂乱。
  • Consolidated memory 像整理后的经验手册,更易复用,但可能改写失真。
  • 更稳的设计往往不是“每轮都总结”,而是先保留原始经历,再对 consolidation 做显式门控。

用更通俗的话说,写入策略像什么

写入策略就像给代理立规矩:不是每句话都进档案室,也不是每个细节都值得存十年。它决定的是“什么算重要、什么只是路过”。

  • 每轮都写,像是把所有草稿都塞进档案柜。
  • 重要性筛选,像是先打标签,再决定是否归档。
  • Consolidation,像是把多页会议纪要整理成一页正式结论再入库。
Failure Modes

常见失败模式

每轮都写,导致长期层快速积累噪声
规则过死,导致高价值非标准信息被漏记
先抽取再写入,但抽取质量不稳,反而把错误固化
Previous Chapter
3. Working Memory

工作记忆怎么组装

看真正喂给模型的上下文如何编排

Next Chapter
5. Memory Hygiene

如何避免记忆污染

看长期运行后记忆是否还能保持可信