Agent Memory Field Guide

把 agent memory拆成 6 个可比较维度，再加 2 个总结章节

这版首页不再把所有内容挤成一个长页面，而是作为总览地图：你先在这里看清楚比较框架，再进入每个维度的独立页面做深入阅读。除了机制 taxonomy，本版也更强调 memory system design 视角，例如分层架构、写入管线、检索编排、生命周期治理与评估指标。

比较维度

6+2

6 个设计维度，外加 2 个总结章节

基础骨架

Short-term / Long-term / Working Memory

详情页面

6 个维度页，加 2 个总结页

Base Model

先把基础三层想清楚

参考 Agent Wiki 的骨架，memory 至少要先分清楚短期、长期与工作记忆。后续 6 个维度，其实都是在这三层基础上继续下钻。

短期记忆 Short-term

保存最近几轮对话、工具输出和即时状态，常见形态是 Buffer、Window、Summary。

长期记忆 Long-term

跨会话持久化保存事实、偏好、经验和结构关系，底层可能是 Vector、Graph、Relational 或 Hybrid。

工作记忆 Working Memory

当前回合真正喂给模型的上下文，由用户输入、最近窗口、检索结果和任务状态共同组装。

Six Dimensions

6 个比较维度 + 2 个总结章，每一章都单独展开

首页现在更像一张阅读地图：前面 6 章负责拆开 memory 的关键维度，后面 2 章负责把这些维度重新收束成整体视角和 agent 类型视角。这样读者既可以逐章深入，也能在最后回到一张完整的全局图里理解这些机制为什么会一起出现。

1. Short-term Memory

短期记忆怎么管

短期记忆决定 agent 这一刻手边还留着哪些信息。它不只是聊天记录，而是在有限上下文窗口 L_context 里，帮系统留住下一步最可能用得上的内容。

Focus

看当前上下文怎么保留与压缩

Preview Questions

最近几轮是保留原文，还是压缩成摘要？
token 预算逼近上限时，谁先被截断：闲聊、工具日志还是任务状态？

查看独立页面

2. Long-term Memory

长期记忆怎么存

长期记忆负责把放不进上下文窗口的大量知识和旧经验存起来，并在需要的时候把真正相关的那部分找回来。重点不只是“存住”，更是“之后还能找对”。

Focus

看记忆底层表示如何承接不同信息类型

Preview Questions

要记的是语义片段、实体关系，还是稳定业务状态？
查询更重近似召回，还是精确命中？

查看独立页面

3. Working Memory

工作记忆怎么组装

工作记忆负责把这一轮真正该看的材料摆到模型眼前。它不负责长期存档，但它直接决定模型这一刻到底看见了什么。

Focus

看真正喂给模型的上下文如何编排

Preview Questions

top-k 是固定值，还是按任务动态调整？
排序看 relevance、recency、importance，还是 source priority？

查看独立页面

4. Write Policy

何时写入长期记忆

长期记忆第一关不是怎么查，而是什么时候该写进去。什么值得记、什么时候记、记成什么样，基本决定了后面检索质量的上限。

Focus

看什么信息被允许沉淀为长期记忆

Preview Questions

每轮都写，还是只在关键事件和任务收束时写？
是存原文、存摘要、存事实，还是存关系与经验？

查看独立页面

5. Memory Hygiene

如何避免记忆污染

memory 不是只会越记越聪明的模块。没有清理和约束，系统会慢慢积累重复、冲突、过期信息，最后变成“记得很多，但越来越不准”。

Focus

看长期运行后记忆是否还能保持可信

Preview Questions

系统如何处理重复、冲突、过期与错误记忆？
不同用户、任务、项目、agent 之间是否有清晰 scope 边界？

查看独立页面

6. Memory Objectives

记忆服务于什么

同样都叫 memory，不同 agent 想解决的问题可能完全不同。目标不先说清楚，前面所有设计都容易做散。

Focus

看整套记忆最终为哪类能力服务

Preview Questions

系统是为了记住用户、记住任务，还是记住做事经验？
更重视稳定 profile、上下文连续，还是工具执行反馈？

查看独立页面

7. Agent Memory Global Map

从全局角度看，memory 机制是怎么分工的

如果把 agent memory 当成一个整体来看，它不是一个单点能力，而是一条从“眼前保留什么”到“长期存什么”、再到“当前怎么用”和“跑久了怎么不变脏”的完整链路。很多讨论之所以混乱，就是因为把这些层混在一起谈了。

Focus

看 memory 机制作为整体时如何分层、分工与组合

Preview Questions

你现在讨论的是“怎么存”、还是“怎么取”、还是“怎么在当前回合用起来”？
系统最缺的是短期上下文管理、长期召回、工作记忆编排，还是写入和治理？

查看独立页面

8. Agent Memory Patterns

按 agent 类型看，memory 组合为什么会不一样

同样都在做 memory，不同 agent 真正在解决的问题其实很不一样，所以最后长出来的 memory 组合也不会一样。真正值得比较的，不只是“用了什么库”，而是它到底想记住什么、最怕忘掉什么、以及愿意为此付出多少复杂度和成本。

Focus

看不同 agent 为什么会长出不同 memory 组合

Preview Questions

这个 agent 最怕忘掉的是用户偏好、知识资料、任务状态，还是做事经验？
它更需要“记得像同一个人”，还是“做事更稳、更能续上进度”？

查看独立页面

Design Checklist

如何比较一个 agent memory 方案

真正有用的比较框架，不是问“有没有长期记忆”，而是看短期、长期、工作记忆与治理目标是否在同一条设计线上。

短期记忆使用 Buffer、Window、Summary，还是 recent raw + rolling summary 的混合结构？

长期记忆底层是 Vector、Graph、Relational 还是 Hybrid，分别承接哪类信息？

工作记忆如何组装：top-k 多少、排序逻辑是什么、token budget 如何分配？

长期写入策略是什么：每轮都写、规则触发、重要性筛选，还是 consolidation 之后再写？

污染治理机制是否完备：去重、冲突处理、scope isolation、provenance、TTL、decay、删除？

系统主要服务于哪类目标：Personalization、Continuity、Task Execution 还是 Skill Evolution？

如果放到具体 agent 类型里看，这套 memory 更像陪伴型、知识型、任务型、项目型，还是学习型？它真正的优势和代价分别是什么？

继续阅读

如果首页解决的是“怎么搭比较框架”，这些资料则继续回答“这个框架为什么成立、研究里怎么讨论、工程上有哪些风险”。

Agent Wiki · Memory

用短期 / 长期 / 工作记忆给出最基础也最适合工程沟通的骨架。

Link

Memory for Autonomous LLM Agents (2026)

从机制、评测与前沿方向系统梳理 memory 研究版图。

Link

A Survey on the Memory Mechanism of LLM-based Agents (2024)

帮助把 buffer / retrieval / reflection / long-term memory 放入更完整 taxonomy。

Link

Remembering More, Risking More (2026)

提醒 memory 不是纯增益项，长期运行会带来时间维度上的安全与污染风险。

Link