短期记忆怎么管
短期记忆决定 agent 这一刻手边还留着哪些信息。它不只是聊天记录,而是在有限上下文窗口 L_context 里,帮系统留住下一步最可能用得上的内容。
看当前上下文怎么保留与压缩
- 最近几轮是保留原文,还是压缩成摘要?
- token 预算逼近上限时,谁先被截断:闲聊、工具日志还是任务状态?
这版首页不再把所有内容挤成一个长页面,而是作为总览地图: 你先在这里看清楚比较框架,再进入每个维度的独立页面做深入阅读。除了机制 taxonomy,本版也更强调 memory system design 视角,例如分层架构、写入管线、检索编排、生命周期治理与评估指标。
6 个设计维度,外加 2 个总结章节
Short-term / Long-term / Working Memory
6 个维度页,加 2 个总结页
参考 Agent Wiki 的骨架,memory 至少要先分清楚短期、长期与工作记忆。后续 6 个维度,其实都是在这三层基础上继续下钻。
保存最近几轮对话、工具输出和即时状态,常见形态是 Buffer、Window、Summary。
跨会话持久化保存事实、偏好、经验和结构关系,底层可能是 Vector、Graph、Relational 或 Hybrid。
当前回合真正喂给模型的上下文,由用户输入、最近窗口、检索结果和任务状态共同组装。
首页现在更像一张阅读地图:前面 6 章负责拆开 memory 的关键维度,后面 2 章负责把这些维度重新收束成整体视角和 agent 类型视角。这样读者既可以逐章深入,也能在最后回到一张完整的全局图里理解这些机制为什么会一起出现。
短期记忆决定 agent 这一刻手边还留着哪些信息。它不只是聊天记录,而是在有限上下文窗口 L_context 里,帮系统留住下一步最可能用得上的内容。
看当前上下文怎么保留与压缩
长期记忆负责把放不进上下文窗口的大量知识和旧经验存起来,并在需要的时候把真正相关的那部分找回来。重点不只是“存住”,更是“之后还能找对”。
看记忆底层表示如何承接不同信息类型
工作记忆负责把这一轮真正该看的材料摆到模型眼前。它不负责长期存档,但它直接决定模型这一刻到底看见了什么。
看真正喂给模型的上下文如何编排
长期记忆第一关不是怎么查,而是什么时候该写进去。什么值得记、什么时候记、记成什么样,基本决定了后面检索质量的上限。
看什么信息被允许沉淀为长期记忆
memory 不是只会越记越聪明的模块。没有清理和约束,系统会慢慢积累重复、冲突、过期信息,最后变成“记得很多,但越来越不准”。
看长期运行后记忆是否还能保持可信
同样都叫 memory,不同 agent 想解决的问题可能完全不同。目标不先说清楚,前面所有设计都容易做散。
看整套记忆最终为哪类能力服务
如果把 agent memory 当成一个整体来看,它不是一个单点能力,而是一条从“眼前保留什么”到“长期存什么”、再到“当前怎么用”和“跑久了怎么不变脏”的完整链路。很多讨论之所以混乱,就是因为把这些层混在一起谈了。
看 memory 机制作为整体时如何分层、分工与组合
同样都在做 memory,不同 agent 真正在解决的问题其实很不一样,所以最后长出来的 memory 组合也不会一样。真正值得比较的,不只是“用了什么库”,而是它到底想记住什么、最怕忘掉什么、以及愿意为此付出多少复杂度和成本。
看不同 agent 为什么会长出不同 memory 组合
真正有用的比较框架,不是问“有没有长期记忆”,而是看短期、长期、工作记忆与治理目标是否在同一条设计线上。
短期记忆使用 Buffer、Window、Summary,还是 recent raw + rolling summary 的混合结构?
长期记忆底层是 Vector、Graph、Relational 还是 Hybrid,分别承接哪类信息?
工作记忆如何组装:top-k 多少、排序逻辑是什么、token budget 如何分配?
长期写入策略是什么:每轮都写、规则触发、重要性筛选,还是 consolidation 之后再写?
污染治理机制是否完备:去重、冲突处理、scope isolation、provenance、TTL、decay、删除?
系统主要服务于哪类目标:Personalization、Continuity、Task Execution 还是 Skill Evolution?
如果放到具体 agent 类型里看,这套 memory 更像陪伴型、知识型、任务型、项目型,还是学习型?它真正的优势和代价分别是什么?
如果首页解决的是“怎么搭比较框架”,这些资料则继续回答“这个框架为什么成立、研究里怎么讨论、工程上有哪些风险”。
用短期 / 长期 / 工作记忆给出最基础也最适合工程沟通的骨架。
从机制、评测与前沿方向系统梳理 memory 研究版图。
帮助把 buffer / retrieval / reflection / long-term memory 放入更完整 taxonomy。
提醒 memory 不是纯增益项,长期运行会带来时间维度上的安全与污染风险。