Dryft:如果 AI memory 像生态系统而不是文件柜,会怎样?
看起来您只提供了来源链接,而没有提供需要翻译的正文内容。请把您想要翻译的文本粘贴在这里,我会为您翻译成简体中文。
概述
我是一名在西加拿大的蔬菜农夫,运营着一个区域性食品中心。我不是开发者,但我花了很多时间思考系统是如何运作的、各部分如何相互作用,以及当它们不工作时会发生什么。
当前 AI 记忆的问题
我不断看到的模式——无论是在 AI 代理还是许多技术系统中——都是 孤立。当今的记忆本质上是一个静态字段:
- 将内容写入文件。
- 搜索相似文本。
- 当上下文窗口满时,进行压缩。
- 重要信息会消失。
- 旧的决策与当前的决策权重相等。
- 没有任何东西会衰老、关联或消亡。
在自然界,记忆的工作方式不同。
- 强化 – 重要的事物会变得更强。
- 衰减 – 那些不会消失的事物。
- 关联绑定 – 相关的项目会相互结合。
- 捕食 – 系统会移除那些它再也无法承载的内容。
这不仅仅是存储;它是 生态。
Source:
Dryft:生态型 AI 记忆系统
Dryft 将记忆视为 活的种群(一群)并自行调节。
| 功能 | 描述 |
|---|---|
| 适应度出现 | 被使用的记忆会变得更强;未使用的记忆会随时间衰弱。无需手动策划。 |
| 关系绑定 | 同时被激活的记忆会形成关联。关系来源于使用模式,而非手工构建的知识图谱。 |
| 捕食者 | 连续多个周期适应度为零的记忆会被自动清除。系统是“减法”,而非仅仅“加法”。 |
| 具有寿命的记忆类型 | 情景记忆(快速衰减) vs. 语义记忆(慢速衰减)。 |
| 冲突检测 | 矛盾的记忆会被标记并呈现出来,以便解决。 |
| 时间感知 | 生态元数据记录创建时间、血统以及被取代的情况。 |
| 分解 | 当记忆死亡时,其“物质”会喂养 草层,从而孕育出新的通用知识。 |
对智能体为何重要
管理工作和生活的智能体不可避免地会出现记忆膨胀:
- 一周前查询项目截止日期,下一周查食谱,再下一周查代码架构。
- 数百条条目堆积,而一个琐碎事实(例如“鸡蛋要煮多久”)的权重与关键的架构决策相同。
在 Dryft 中,鸡蛋的记忆 会淡化,因为它不再被引用,而架构决策则通过反复激活保持强度。生态系统决定保留什么,而不是用户。
代理记忆的核心问题(以及 Dryft 的解决方案)
| 问题 | 传统方法 | Dryft 的生态解决方案 |
|---|---|---|
| 压缩过程中的上下文丢失 | 对长会话进行摘要 → 细节消失 | 基于适应度的强化确保重要信息在压缩前已足够强大。 |
| 记忆之间缺乏关联 | 平面文本搜索 → 没有跨概念链接 | 共激活绑定产生有机连接;无需显式图谱提取。 |
| 记忆膨胀 | 条目无限累积 | 捕食者剔除低适应度记忆,使整体保持精简。 |
| 陈旧记忆与当前记忆同等对待 | 没有衰减 → 旧决策与新决策权重相同 | 按记忆类型衰减,自然削弱未使用的旧记忆。 |
Dryft 架构
+-------------------+ +-------------------+
| Foundational Layer| | Grass Layer |
| (permanent core) | | (substrate for |
| | | new general |
| | | knowledge) |
+-------------------+ +-------------------+
| |
v v
+-------------------+ +-------------------+
| Main Herd | | Evaluation Herd |
| (operational | | (opinion / |
| memories) | | evaluative) |
+-------------------+ +-------------------+
| |
v v
+-------------------+ +-------------------+
| Dormancy Staging | | Temporal Layer |
| (incubator for | | (time‑aware |
| new signals) | | reasoning) |
+-------------------+ +-------------------+- Foundational Layer – 永久核心知识。
- Grass Layer – 为新记忆提供养分的基质(分解产物)。
- Main Herd – 运营记忆(“牛群”)。
- Evaluation Herd – 用于评估/意见记忆的独立群体(“羊群”)。
- Dormancy Staging – 新信号加入群体前的孵化器。
- Temporal Layer – 提供时间感知推理和血统追踪。
冲突检测与 “人道调度”
- 系统识别矛盾的记忆。
- 以对话形式呈现冲突。
- 用户可以确认删除(“人道调度”)。
- 错误的记忆不会被分解,因为它们的基底价值为零。
基准测试与结果
| 基准 | 分数 | 备注 |
|---|---|---|
| 自定义 56‑查询基准(加权) | 83 % | 类别: • 单跳召回 – 100 % • 多跳推理 – 73 % • 时间查询 – 70 % • 开放域 – 58 % • 对抗性幻觉陷阱 – 100 % 由独立评审模型评分。 |
| LOCOMO(标准化研究基准) | 50 % | 展示了在行业广泛任务上仍有提升空间。 |
自定义基准反映了我的个人使用模式;LOCOMO 提供了更一般的比较。
要点
Dryft 展示了 生态原则——适应性、联结、捕食、衰变和分解——能够将一个静态、不断增长的记忆存储转变为 自我调节、精简且具上下文感知 的系统。通过让整体决定哪些信息存活、哪些信息消亡,我们可以得到:
- 随着时间推移,检索相关性更高。
- 在无需手动构建图谱的情况下,自然产生关系。
- 自动移除陈旧或不相关的信息。
如果你使用代理来管理工作和生活,考虑采用像 Dryft 这样的生态记忆模型,以保持你的系统 精简、相关且充满活力。
概览
- Dryft 是一个实验性的记忆系统,展示了涌现行为和生态设计原则。
- 基准测试显示它的表现优于可比系统(例如 Mem0 66.9 % 对比 OpenAI Memory 53 %)。
- 主要缺口:
- 时间提取失败(相对日期未解析)。
- 捕食者对记忆的清除,而这些记忆随后又出现在基准测试中。
这些问题是 可修复 的。捕食者清除的权衡是有意为之:在实际使用中,我们倾向于修剪陈旧记忆,即使这会在对每个查询一视同仁的基准测试上扣分。
关键观察
涌现行为 – 并非显式编码:
- 当记忆的适应度降至零时,只要再次变得相关,它们可以 自行恢复。
- 记忆通过 键合形成簇,类似于我自然的主题思考方式。
项目状态 –
- 尚未达到生产就绪,但架构已可运行,基准测试也验证了其有效性。
- 将其扩展为代理框架插件需要的开发工作量超出我个人能够承担的范围。
我的角色 – 我是 系统思考者,而非开发者或项目经理。我提供:
- 一套 设计方法论,能够持续产出成果。
- 15 年的观察复杂自组织活体系统的经验。
生态框架 – 这并非装饰性的概念;它是所有特性的来源。该架构源自观察种群自我调节的过程,而非逆向工程现有记忆系统。
开源发布
我在 MIT 许可证 下发布 Dryft,因为我希望它能在实际应用中发挥作用。AI 记忆对每个人都至关重要,而当前的解决方案感觉像是“冒充大脑的文件柜”。
- 拿去用,跑起来,并加以改进。
- 如果你有兴趣扩展生态方法,我很乐意继续参与。设计方法论是我的主要贡献;生物直觉是一种思考方式,无法在 README 中完整表达。
欢迎任何反馈——无论是赞扬还是批评。如果你用 Dryft 构建了东西,能够给个致谢我会很感激,但我的主要目标是看到它在真实环境中被使用。
仓库
🔗 GitHub:
核心文件
| 文件 | 描述 |
|---|---|
herd_engine.py | 生态引擎:适应度、衰减、关联、捕食者、分解 |
proxy.py | 集成层:上下文注入、信号检测、冲突处理、多轮对话 |
signal_detector.py | 从对话中提取值得记忆的信号 |
conflict_detector.py | 识别矛盾的记忆 |
temporal_utils.py | 时间感知推理与取代检测 |
benchmark_full.json | 56 条查询基准及结果 |
License
MIT License随意对代码做任何你想做的事。