01 项目总览与动机

前置知识#

本文目标#

完成阅读后，你将理解：

什么是 Agent 长期记忆，以及为什么 LLM Agent 需要它
这个项目试图解决什么工程问题
为什么仓库选择 SQLite、Go + Python、Protobuf 和 RRF
后续各篇教学文档分别负责回答什么问题

什么是 Agent 记忆#

大语言模型本身没有跨会话持久状态。
一次对话结束后，模型参数不会因为这次交互而自动写回用户长期偏好、项目背景或历史决策。

这会带来三个直接问题：

跨会话失忆：第二天继续工作时，系统记不住昨天确认过的事实；
检索缺少结构：就算把内容塞进向量库，也难以回答“为什么”“之前发生了什么”这类问题；
演化不可解释：一条记忆被更新、冲突、删除或降级后，系统很难说明过程。

Agent 长期记忆系统的核心职责有三项：

保存可追溯的事实、偏好、过程和关系；
在查询时按意图选择合适的检索路径；
在时间维度上管理记忆的新鲜度、可信度和冲突。

这个项目要解决什么问题#

本项目的目标很明确：提供一个 本地优先、零配置、可解释、MCP 原生 的 Agent 记忆引擎。

仓库重点解决的场景包括：

本地开发 Agent，需要 pip install 后立即可用；
个人 Copilot 或自动化脚本，需要持久化用户偏好与项目背景；
面试或作品集展示，需要能够讲清楚架构、算法、协议和测试策略。

项目提供两种运行模式：

嵌入模式：Python MemoryClient 直接访问 SQLiteBackend
服务模式：Python 端通过 RemoteBackend 调用 Go 服务的 REST / gRPC 接口

graph TD
    A["Client / CLI / MCP"] --> B["MemoryClient"]
    B --> C{"Mode"}
    C -->|"embedded"| D["Python SQLiteBackend"]
    C -->|"remote"| E["RemoteBackend"]
    E --> F["Go REST / gRPC"]
    F --> G["Go Storage Engine"]
    G --> H[("SQLite")]

mermaid

为什么当前方案和常见方案不同#

与“只做向量检索”的方案相比#

通用向量库擅长“存向量 + 近邻检索”，但 Agent 记忆还需要：

规则路由
因果追踪
冲突检测
审计与演化记录
时间衰减与层级迁移

因此，这个项目把“记忆”当作一个带治理规则的数据系统来设计，而不是只把它当作 embedding 容器。

与“重依赖外部组件”的方案相比#

很多记忆框架会假设你已经有：

独立向量数据库
额外图数据库
外部消息队列
一整套云端组件

这个仓库更强调单机和本地工具链的实际可用性：

SQLite 让部署门槛足够低；
Python 负责提取、嵌入、MCP 与 SDK 体验；
Go 负责服务层、协议层和数据面性能。

关键设计哲学#

本地优先#

默认数据库是单文件 SQLite。
对于个人 Agent、桌面工具和小型团队内部助手，这种部署方式更容易复制、调试和备份。

零配置#

最短路径只需要：

pip install agent-memory-engine
agent-memory store "User prefers SQLite." --source-id demo
agent-memory search "What database does the user prefer?"

bash

可解释#

系统不只返回“查到了什么”，还尽量说明：

通过哪一路策略命中；
是否存在祖先链；
是否进入冲突关系；
是否被维护周期提升或降级。

MCP 原生#

src/agent_memory/interfaces/mcp_server.py 提供 11 个工具，覆盖存储、搜索、追踪、审计、演化、维护和导出，方便接入支持 MCP 的客户端。

技术选型理由#

为什么用 `SQLite`#

零配置，适合本地优先场景；
支持 WAL，读多写少的 Agent 负载很合适；
自带 FTS5，全文检索不需要额外组件；
单文件备份和迁移很直接。

为什么用 `Go + Python`#

Python 更适合承接嵌入模型、LLM 客户端、MCP 和开发者体验；
Go 更适合承接服务层、gRPC、并发请求和单二进制部署；
双语言分工清晰，适合面试时展示“智能面 + 数据面”的边界。

为什么用 `Protobuf`#

Python 和 Go 共享一套数据契约；
gRPC 接口可以稳定演进；
MemoryItem、RelationEdge、SearchResult 等模型能保持一致。

为什么用倒数排名融合 `RRF`#

多路检索的分数刻度不统一。语义检索、全文检索和实体检索的原始分数很难直接混算。
RRF 使用排名位置做融合，更容易保持稳定性和可测性。

与 Mem0 的技术对比#

这一节是计划里要求补充的重点。下面的比较基于 Mem0 官方文档与公开仓库中当前展示的 OSS 形态：它支持 Python 和 Node.js SDK，默认使用 OpenAI LLM / embedding，默认向量库是本地 Qdrant，也支持外接向量数据库、图记忆和 reranker 配置。

一句话先说结论#

Mem0 更像可配置、可扩展的通用记忆平台；
本项目 更像本地优先、部署极轻、可解释性更强的教学型与工程型样板。

对比表#

维度	本项目	Mem0 OSS
默认部署	单机 SQLite，可直接嵌入	Python / Node SDK，默认仍需 LLM 与向量配置
默认存储	SQLite 主库，Python 可选 `sqlite-vec`	官方文档默认向量库为本地 Qdrant，历史存储为 SQLite
服务端语言	Go + Python	Python + Node.js
协议层	REST + gRPC + MCP + CLI	SDK + REST 文档路径，更偏平台化接入
关系建模	内置 `causal_parent_id`、`relations`、递归追踪	官方文档支持 Graph Memory，但通常依赖外部图后端
冲突治理	内置冲突检测、trust 回写、演化 / 审计日志	更强调记忆抽取、检索、reranker 和图能力
部署复杂度	很低，单库即可启动	更灵活，但通常需要接 LLM、向量库等外部组件
离线能力	强，embedded 模式可完全离线运行	官方文档强调可自托管和离线控制，但默认组件含外部模型服务
教学可讲性	很强，算法和存储细节都在仓库内	更适合做通用平台能力对接

为什么要做出这样的取舍#

这个项目的重点不在“把所有外部能力都接进来”，而在：

让一台机器、一个仓库就能把长期记忆系统讲完整；
让每条写入和查询链路都能被源码直接解释；
让部署、调试、演示、面试复盘都尽量顺滑。

如果你的目标是“快速接一个成熟记忆平台”，Mem0 很有吸引力；
如果你的目标是“做一个自己能完全掌控和讲清楚的记忆引擎样板”，本项目更合适。

项目数据概览#

计划要求这里加入更具体的项目数据，而不是泛泛而谈。

代码与接口规模#

项目指标	当前规模
Go 源码行数	`7774`
Python 源码行数	`4478`
核心源码总量	`12252`
Python 测试函数数	`43`
Go 测试 + 基准函数数	`31`
REST 能力数	`20`
gRPC RPC 数	`18`
MCP 工具数	`11`
教学文档篇数	`12`

这些数字代表什么#

不是玩具项目：1 万多行核心源码已经足够体现架构分层、协议设计和治理逻辑。
接口覆盖面完整：REST、gRPC、MCP、CLI 四套入口同时存在，说明它既能给程序用，也能给人调试。
测试基础扎实：双语言都有测试面，不是“文档写得好看，代码没人验证”。

这个项目作为求职作品的价值#

从作品集角度看，这个仓库同时覆盖了几类能力：

后端工程：Go 服务、SQLite schema、REST、gRPC、认证、中间件、优雅关停
AI 工程：提取管线、嵌入提供器、意图路由、冲突检测、遗忘策略
协议设计：Protobuf 契约、双语言代码生成、metadata 认证
质量保障：Python 测试、Go 测试、基准测试、k6 压测、CI
文档表达：既能讲运行方式，也能讲算法细节和系统取舍

这类项目最大的优势是“横切面很多，但又不是散的”。
所有能力都围绕“长期记忆系统”这个主线收束起来，面试官更容易形成整体印象。

功能全景图#

graph TD
    A["存储 / Store"] --> B["搜索 / Search"]
    B --> C["追踪 / Trace"]
    C --> D["治理 / Governance"]
    D --> E["导出 / Export"]
    B --> F["意图路由 / Router"]
    F --> G["RRF 融合 / RRF"]
    D --> H["遗忘 / Forgetting"]
    D --> I["冲突 / Conflict"]
    A --> J["REST / gRPC / MCP / CLI"]

mermaid

仓库结构导览#

agent-memory/
├── benchmarks/
├── deploy/
├── docs/
│   └── teaching/
├── go-server/
├── proto/
├── src/agent_memory/
└── tests/

text

关键目录职责如下：

src/agent_memory/：Python SDK、控制器、提取管线、存储后端、MCP 接口
go-server/：Go 服务入口、网关、gRPC、存储引擎、治理模块
proto/：Protobuf 契约
benchmarks/：Python 微基准、Go 对比脚本、k6 负载测试
docs/teaching/：当前这套中文教学文档

这个项目最适合什么场景#

为了避免把项目讲得过大，面试里最好主动说明它最适合的使用区间。

最适合的三类场景#

个人 Agent：例如桌面 Copilot、知识助手、自动化脚本，需要长期记住用户偏好和工作上下文。
教学与作品集：需要一个能完整讲清系统设计、算法策略、协议层和质量保障的项目样板。
小规模内部工具：团队成员不多，更重视部署简单、可本地调试和可解释性。

目前不主打的场景#

超大规模多租户 SaaS；
高频分布式写入；
强依赖云端向量数据库与图数据库的复杂平台。

这样说的好处是，项目定位会更清楚，后面的技术选型也更容易自洽。

如果第一次接触仓库，建议先跑什么#

最顺的入门顺序通常是：

先用 Python embedded 模式本地写一条记忆、查一条记忆；
再启动 Go 服务，试一次远程模式；
再看 docs/teaching/03 和 docs/teaching/04，把算法和服务端骨架对起来；
最后再看 benchmark 和部署文档。

这一顺序对应的是“先建立感性认识，再回头理解架构”的阅读方式，比一上来就啃全部源码更有效。

建议阅读顺序#

如果你想补充性能与工程落地这一段，建议再补：

11 性能与基准测试

小结#

Agent 记忆系统的难点在于“存下来”之后的检索、治理与解释
这个项目围绕本地优先、零配置和可解释三个目标展开
SQLite、Go + Python、Protobuf 和 RRF 都服务于明确的工程取舍
和 Mem0 相比，本项目更强调轻部署、内聚的治理链路和源码可讲性
仓库既能作为可运行项目，也能作为讲解系统设计的作品集

本系列目录

前置知识#

本文目标#

什么是 Agent 记忆#

这个项目要解决什么问题#

为什么当前方案和常见方案不同#

与“只做向量检索”的方案相比#

与“重依赖外部组件”的方案相比#

关键设计哲学#

本地优先#

零配置#

可解释#

MCP 原生#

技术选型理由#

为什么用 `SQLite`#

为什么用 `Go + Python`#

为什么用 `Protobuf`#

为什么用倒数排名融合 `RRF`#

与 Mem0 的技术对比#

一句话先说结论#

对比表#

为什么要做出这样的取舍#

项目数据概览#

代码与接口规模#

这些数字代表什么#

这个项目作为求职作品的价值#

功能全景图#

仓库结构导览#

这个项目最适合什么场景#

最适合的三类场景#

目前不主打的场景#

如果第一次接触仓库，建议先跑什么#

建议阅读顺序#

小结#

延伸阅读#

继续阅读

本系列目录

01 项目总览与动机

前置知识#

本文目标#

什么是 Agent 记忆#

这个项目要解决什么问题#

为什么当前方案和常见方案不同#

与“只做向量检索”的方案相比#

与“重依赖外部组件”的方案相比#

关键设计哲学#

本地优先#

零配置#

可解释#

MCP 原生#

技术选型理由#

为什么用 SQLite#

为什么用 Go + Python#

为什么用 Protobuf#

为什么用倒数排名融合 RRF#

与 Mem0 的技术对比#

一句话先说结论#

对比表#

为什么要做出这样的取舍#

项目数据概览#

代码与接口规模#

这些数字代表什么#

这个项目作为求职作品的价值#

功能全景图#

仓库结构导览#

这个项目最适合什么场景#

最适合的三类场景#

目前不主打的场景#

如果第一次接触仓库，建议先跑什么#

建议阅读顺序#

小结#

延伸阅读#

继续阅读

为什么用 `SQLite`#

为什么用 `Go + Python`#

为什么用 `Protobuf`#

为什么用倒数排名融合 `RRF`#