Vector Store
把文本块编码为高维 embedding,利用语义相似度做长期召回,是 LLM agent 最常见的长期记忆底座。
天然适合语义搜索,适合海量文本知识与历史经验的近似匹配检索。
精确字段更新、冲突消解、强结构关系查询较弱;检索质量高度依赖 chunking、embedding 模型与索引策略。
偏好、案例、文档、知识片段、历史经验等语义型长期记忆。
可以把长期记忆想成代理的资料库。短期记忆像桌面,长期记忆像档案室。桌面放不下的内容,就要存到档案室里;等需要时,再快速找回来。这个档案室不一定只有一种柜子: 有些信息更适合放进向量检索层,有些更适合放进关系库或状态表。向量数据库和嵌入最擅长处理的是“按意思找资料”,但它们不是长期记忆的全部。
这一组不是“所有相关概念”,而是这个维度最核心、最值得先理解的主线。带下划线的机制可以直接点开,会弹出一个更细的解释窗。
如果只看孤立卡片,机制之间的关系会很模糊。把它们放回 pipeline 中,就能看清每一步在系统里承担什么角色,以及问题通常出在什么位置。
将长文档或经验切成可检索的语义块。
用 embedding 模型将块映射为高维向量。
将向量、原文与元数据写入向量索引或混合存储层。
对查询向量执行 ANN 搜索并取 top-k 邻近块。
按元数据、上下文与相关性进一步筛选和重排。
将最终文本块和元数据送回工作记忆层。
把文本块编码为高维 embedding,利用语义相似度做长期召回,是 LLM agent 最常见的长期记忆底座。
天然适合语义搜索,适合海量文本知识与历史经验的近似匹配检索。
精确字段更新、冲突消解、强结构关系查询较弱;检索质量高度依赖 chunking、embedding 模型与索引策略。
偏好、案例、文档、知识片段、历史经验等语义型长期记忆。
以实体和关系为核心,将记忆显式组织成网络结构。
把记忆作为稳定字段和结构化状态管理。
多种存储并存,让语义、关系和精确状态各回各位,向量数据库通常只承担其中一层。
用户今天问一个框架的架构设计,下周回来再问“上次提到的检索模块有什么风险?”。如果长期记忆能做语义检索,系统能把上次讨论中真正相关的资料重新召回。
如果一份设计文档被切得过碎,检索时只能拿到零散句子;切得过大,又会把不相关内容一起带回来。
这一部分补充的是更偏 memory system design 的视角:不只看概念本身,而是看这些机制在真实系统里应该放在哪一层、如何被组织、如何被观测。
长期记忆里有一大类非常常见的内容,是自然语言知识、案例和历史经验。对这类内容来说,语义搜索比关键词匹配更实用,因为它能找“意思相近”的内容。这就是 embedding 最有用的地方。但这说的是长期记忆里的一个大类问题,不是说所有长期记忆都必须走这条路。
向量数据库的价值,不是替代所有长期记忆,而是把“按意思找资料”这件事做得可扩展。它负责的是长期记忆中的语义检索层: 当你有很多文本块、案例和历史经验,需要在海量向量里快速找出和当前问题最接近的那几条内容时,它就很有用。
很多团队会纠结该选 Pinecone、Milvus 还是 Chroma,但真正更影响效果的,通常是 chunk 怎么切、embedding 怎么做、检索链路怎么走。
长期记忆最难的地方,不是看能存多少,也不是默认选某一种存储,而是看系统能不能用合适的表示,把远处但真正有用的记忆带回当前推理。
看当前上下文怎么保留与压缩
看真正喂给模型的上下文如何编排