别再把所有 AI 记忆视为相同——介绍 Cortex,谁忘记了?
Source: Dev.to
请提供您希望翻译的完整文本(除代码块和 URL 之外),我将按照要求将其翻译成简体中文并保留原有的 Markdown 格式。
统一 AI 记忆的问题
一个快速事实(例如,“PostgreSQL 运行在 5432 端口”)不同于学习到的模式(例如,“对高流量服务始终使用连接池”)。
一次部署事件不同于用户偏好。
大多数 AI 记忆方案——RAG、向量存储、简单键值缓存——都把所有内容倾倒到同一个桶里。一次性的调试笔记与关键的架构决策并列,拥有相同的优先级、相同的检索权重和相同的生命周期。
结果: 上下文窗口被无关噪声塞满。你的 AI 会以与日常使用的模式同等的置信度检索到六个月前的 bug 修复。
Cortex: 多阶段分类
Titan Memory 包含 Cortex,一个多阶段分类器,将每条进入的记忆路由到五个认知类别之一。
| 类别 | 存储内容 | 衰减速率 |
|---|---|---|
| Knowledge | 事实、定义、技术信息 | 缓慢 — 事实持久 |
| Profile | 偏好、设置、用户上下文 | 非常缓慢 — 偏好保持 |
| Event | 会话、部署、事件 | 快速 — 事件很快过期 |
| Behavior | 模式、习惯、工作流 | 缓慢 — 模式有价值 |
| Skill | 技巧、解决方案、最佳实践 | 非常缓慢 — 技能持久 |
每个类别的衰减速率不同。您上周二遇到的错误会很快消失,而在多个项目中使用的部署模式则会持久保存。
检索流程
在召回时,Cortex 的工作不仅仅是返回 top‑K 向量:
- Hybrid search(稠密向量 + BM25)检索候选文档。
- 对检索到的文档进行 Sentence splitting。
- 使用 0.6 B‑parameter encoder 对每个句子进行 Semantic scoring。
- Pruning 掉低于相关性阈值的句子。
- Temporal conflict resolution(更新的信息优先)。
- Category coverage check,确保召回结果在各类别上均衡,而不仅仅是最高得分的嵌入。
结果: 在每次召回时实现 70–80 % 的 token 压缩;只有最相关的(“gold”)句子会进入 LLM。
安装
claude mcp add titan-memory -- node ~/.claude/titan-memory/bin/titan-mcp.js
使用示例
存储技能
titan_add("Always use connection pooling for high‑traffic Postgres services")
# → Classified: Skill (confidence: 0.94)
# → Routed to Layer 4 (Semantic Memory)
# → Decay half‑life: 270 days
存储事件
titan_add("Deployed v2.3 to production, rolled back due to memory leak")
# → Classified: Event (confidence: 0.91)
# → Routed to Layer 5 (Episodic Memory)
# → Decay half‑life: 90 days
召回信息
titan_recall("Postgres performance best practices")
# → Returns the connection‑pooling skill (still strong after 6 months)
# → The deployment event has decayed unless explicitly requested
架构概览
Titan Memory 是一个 5 层认知记忆系统,以 MCP 服务器的形式提供:
| Layer | Description |
|---|---|
| Layer 1 – Working Memory | 您的活动上下文窗口 |
| Layer 2 – Factual Memory | O(1) 哈希查找,延迟低于 10 ms |
| Layer 3 – Long‑Term Memory | 经过惊讶过滤的自适应衰减 |
| Layer 4 – Semantic Memory | 模式,推理链 |
| Layer 5 – Episodic Memory | 会话日志,时间戳 |
Cortex 是其中一个组件;系统还包括:
- 语义高亮
- 基于惊讶的存储过滤
- 使用 RRF 重排序的混合搜索
- 跨项目模式迁移
测试套件报告 914 个通过的测试,系统可与 Claude Code、Cursor 或任何兼容 MCP 的客户端一起使用。
许可证与来源
- GitHub:
- 许可证: Apache 2.0