你的 AI 代理失忆了。以下是修复方法。

发布: (2026年3月17日 GMT+8 03:35)
5 分钟阅读
原文: Dev.to

Source: Dev.to

Cover image for Your AI Agent Has Amnesia. Here's the Fix.

AI 记忆问题

你可能已经构建了一个在单次会话中表现出色的 AI 代理,但下次启动时它对你是谁、你们一起构建了什么、或者它学到了什么全然没有记忆。用大系统提示、向量存储或把最近 N 条消息塞进上下文来补救,感觉像是临时止血——这并不是根本的解决方案。

为什么上下文窗口不是记忆

上下文窗口相当于 RAM:进程结束后就会消失。真正的记忆具备 RAM 所不具备的三大特性:

  1. 跨会话持久化——能够在重启后仍然存在。
  2. 智能衰减——会忘记噪声,只保留重要信息。
  3. 构建结构——理解事物之间的关系,而不仅仅是“这里有 N 个相似的块”。

向量存储可以提供持久化,但它在智能衰减和结构化关系方面表现不足。结果是得到一堆平铺的嵌入,随着时间推移查询会变得更嘈杂且成本更高。

你真正需要的是一个能够决定 保留什么、忘记什么以及事物之间如何关联 的记忆系统。

我们构建了什么

我们正在构建 TinyHumans,其中的 NeoCortex 记忆层为其提供动力。

NeoCortex 与“直接使用 Chroma”相比,有两大机制让它脱颖而出:

  • 噪声修剪——低价值记忆会自动衰减并被移除,使 NeoCortex 能够在不降低质量的情况下处理 10 M+ 令牌。检索质量会随时间提升,而不是被噪声淹没。
  • GraphRAG——NeoCortex 不再是平铺的嵌入列表,而是构建实体、关系和上下文的知识图谱。查询会在图谱中遍历,返回结构化、丰富的答案,而不是简单的相似块列表。

其结果是一个“第二大脑”,更像人类记忆:重要的内容会留下,噪声会消退,关系会被理解。

NeoCortex diagram

为什么这超越了生产力提升的意义

记忆是当今无状态 LLM 与真正 AGI 之间缺失的架构层。当前最前沿的模型在会话内是出色的推理者,但在调用之间会出现失忆——它们从不累积对合作对象的模型、对方关心的事物或对方的思考方式。

Alpha Human 是我们基于 NeoCortex 构建的消费产品,旨在弥合这一鸿沟:一个能够为你建立潜意识模型的 AI。使用时间越长,它就越能理解你的推理风格、上下文和模式。NeoCortex 正是实现这一切的基础设施。

当前已上线的功能

  • TinyHumans API – 已上线,访问地址为 tinyhumans.ai。提供按使用付费的 Python SDK、其他语言的 REST API,以及 LangChain、CrewAI、LlamaIndex 的集成。
  • Alpha Human beta – 将于周三开放。可通过发送邮件至 founders@tinyhumans.ai 或加入我们的 Discord 申请早期访问。

试一试

pip install tinyhumansai

如果遇到任何阻力,欢迎加入我们的 Discord 讨论。我们还会向任何构建出有趣作品并分享成果的人免费赠送 API 积分——请在 https://x.com/tinyhumansai 私信我们。

0 浏览
Back to Blog

相关文章

阅读更多 »