4. Write Policy

何时写入长期记忆

长期记忆第一关不是怎么查，而是什么时候该写进去。什么值得记、什么时候记、记成什么样，基本决定了后面检索质量的上限。

靠谱的 memory 系统通常不会每轮都写，而是会用规则、重要性评分、事件触发或 consolidation 来筛一遍，只有真正值得长期保留的内容才进库。

Plain Explanation

写入策略就像代理的“记事规则”。不是每句话都值得长期记住，也不是所有重要信息都该立刻入库。写入策略做的事，就是决定什么该记、什么时候记、用什么形式记。

When To Use

当长期记忆越来越大、但召回质量越来越差时，通常要先检查写入策略。
当系统容易把一次性的临时要求当成长期偏好时，说明写入门槛太低。
当你开始关心 memory quality，而不只是 memory quantity 时，就必须设计写入策略。

Design Questions

每轮都写，还是只在关键事件和任务收束时写？
是存原文、存摘要、存事实，还是存关系与经验？
写入决策由规则控制、LLM 决定，还是混合策略？

Evaluation Metrics

写进去的新内容里，有多少其实是重复或噪声

真正重要的信息，有没有被漏掉

新写入的长期记忆，后面到底有没有被再次用到

不同写入策略会额外增加多少 token 和延迟成本

Mainstream Mechanisms

先抓住这一页真正主流的机制主线

这一组不是“所有相关概念”，而是这个维度最核心、最值得先理解的主线。带下划线的机制可以直接点开，会弹出一个更细的解释窗。

3. Importance-gated Write

4. Extract-then-Write

Pipeline

把这些机制放回一条工作流里看

如果只看孤立卡片，机制之间的关系会很模糊。把它们放回 pipeline 中，就能看清每一步在系统里承担什么角色，以及问题通常出在什么位置。

Observe

识别当前回合或任务中可能值得长期保存的信息。

Score

依据规则、事件或重要性评估是否值得持久化。

Normalize

决定以原文、摘要、事实、关系还是经验形式写入。

Persist

将筛选后的记忆写入长期层并附上 metadata。

Consolidate

在后处理阶段进一步整合成更稳定的长期表示。

Mechanisms

扩展机制与细部取舍

Append everything

Always Write

每轮交互都写入长期层，最简单但风险最高。

Strengths

实现快，不容易漏掉可能重要的信息。

Risks

噪声、瞬时需求和错误信息会一起沉淀。

Best Fit

仅适合实验阶段或小规模研究环境。

Rule-based gate

Event-triggered Write

在用户偏好、任务完成、状态变化等关键事件发生时再写入。

Scored persistence

Importance-based Write

先评估记忆的重要性，再决定是否持久化。

Extract then persist

Consolidated Write

先把多轮交互整理为事实、关系或经验，再写入长期层。

Examples

把这一章放进真实场景里看

临时需求被误记成长期偏好

用户今天说“这次请用正式语气写”，系统如果直接把这句话写成长期偏好，下次所有回复都变得过度正式。

Takeaway: 写入策略要能区分“这一轮有效”与“长期有效”。

任务完成后的经验沉淀

代理多次完成同类排障任务后，把原始过程整理成一条稳定经验，再写入长期层，后续就不必每次都从头探索。

Takeaway: 好的写入策略不仅决定记不记，还决定记成什么形态更有价值。

Architecture Notes

从系统设计角度看这个维度

这一部分补充的是更偏 memory system design 的视角：不只看概念本身，而是看这些机制在真实系统里应该放在哪一层、如何被组织、如何被观测。

写入策略最好单独做成一条 memory ingestion pipeline，而不是散落在业务代码里临时拼出来。

更稳的系统会把 extraction、scoring、normalization、persist 分成几个能看见、能排查的步骤。

如果后面还要做 consolidation，写入时就得顺手把足够的 metadata 留好，方便回溯和重整。

Misconceptions

这一章最容易被误解的地方

误解一：写得越多，长期记忆就越聪明。

误解二：只要有打分模型，写入策略就自动合理。

误解三：consolidation 一定会提升质量，实际上也可能把原始经验改坏。

Deep Dive

展开理解这个维度

写入策略为什么是 memory 质量的第一关

长期记忆一旦写进去，后面每次检索、排序和推理都有可能再次用到它。所以写入阶段出错，不是只错一次，而是可能被反复放大。

存得太多，长期层会被碎片和幻觉淹没。
存得太少，系统又无法真正形成跨会话连续性。
所以写入策略的核心不是多写，而是有选择地写。

写入粒度决定后续检索方式

你今天决定怎么写进去，明天系统就只能按这种形态把它找回来。存原文、存摘要、存事实、存关系，其实是在提前决定未来怎么检索、怎么用。

原文适合保真，但会增加冗余和检索噪声。
事实与关系便于整理，但需要抽取和版本化。
经验和技能更有迁移价值，但提炼难度最高。

一个实用的写入设计顺序

很多团队一开始就急着讨论要不要上向量库，反而忘了先回答“哪些东西值得记”。更稳的做法，是先想目标，再倒推写入策略。

如果服务个性化，就优先定义哪些偏好值得长期保存。
如果服务任务执行，就优先定义哪些状态需要跨回合延续。
如果服务 skill 演化，就优先定义哪些成功/失败轨迹值得提炼。

为什么“先保留原始经历，再谨慎 consolidation”越来越重要

近来的研究开始提醒一个问题：把经历总结成长期结论，不一定总是赚的。有时候 consolidation 会把原本有用的经验改写坏。换句话说，摘要不是天然更高级，它也可能丢掉关键证据。

Raw episodes 像原始案卷，保真但杂乱。
Consolidated memory 像整理后的经验手册，更易复用，但可能改写失真。
更稳的设计往往不是“每轮都总结”，而是先保留原始经历，再对 consolidation 做显式门控。

用更通俗的话说，写入策略像什么

写入策略就像给代理立规矩：不是每句话都进档案室，也不是每个细节都值得存十年。它决定的是“什么算重要、什么只是路过”。

每轮都写，像是把所有草稿都塞进档案柜。
重要性筛选，像是先打标签，再决定是否归档。
Consolidation，像是把多页会议纪要整理成一页正式结论再入库。

Failure Modes

常见失败模式

每轮都写，导致长期层快速积累噪声

规则过死，导致高价值非标准信息被漏记

先抽取再写入，但抽取质量不稳，反而把错误固化

Previous Chapter

3. Working Memory

工作记忆怎么组装

看真正喂给模型的上下文如何编排

←

Next Chapter

5. Memory Hygiene

如何避免记忆污染

看长期运行后记忆是否还能保持可信

→