你的 AI 代理失忆了。以下是修复方法。
Source: Dev.to

AI 记忆问题
你可能已经构建了一个在单次会话中表现出色的 AI 代理,但下次启动时它对你是谁、你们一起构建了什么、或者它学到了什么全然没有记忆。用大系统提示、向量存储或把最近 N 条消息塞进上下文来补救,感觉像是临时止血——这并不是根本的解决方案。
为什么上下文窗口不是记忆
上下文窗口相当于 RAM:进程结束后就会消失。真正的记忆具备 RAM 所不具备的三大特性:
- 跨会话持久化——能够在重启后仍然存在。
- 智能衰减——会忘记噪声,只保留重要信息。
- 构建结构——理解事物之间的关系,而不仅仅是“这里有 N 个相似的块”。
向量存储可以提供持久化,但它在智能衰减和结构化关系方面表现不足。结果是得到一堆平铺的嵌入,随着时间推移查询会变得更嘈杂且成本更高。
你真正需要的是一个能够决定 保留什么、忘记什么以及事物之间如何关联 的记忆系统。
我们构建了什么
我们正在构建 TinyHumans,其中的 NeoCortex 记忆层为其提供动力。
NeoCortex 与“直接使用 Chroma”相比,有两大机制让它脱颖而出:
- 噪声修剪——低价值记忆会自动衰减并被移除,使 NeoCortex 能够在不降低质量的情况下处理 10 M+ 令牌。检索质量会随时间提升,而不是被噪声淹没。
- GraphRAG——NeoCortex 不再是平铺的嵌入列表,而是构建实体、关系和上下文的知识图谱。查询会在图谱中遍历,返回结构化、丰富的答案,而不是简单的相似块列表。
其结果是一个“第二大脑”,更像人类记忆:重要的内容会留下,噪声会消退,关系会被理解。

为什么这超越了生产力提升的意义
记忆是当今无状态 LLM 与真正 AGI 之间缺失的架构层。当前最前沿的模型在会话内是出色的推理者,但在调用之间会出现失忆——它们从不累积对合作对象的模型、对方关心的事物或对方的思考方式。
Alpha Human 是我们基于 NeoCortex 构建的消费产品,旨在弥合这一鸿沟:一个能够为你建立潜意识模型的 AI。使用时间越长,它就越能理解你的推理风格、上下文和模式。NeoCortex 正是实现这一切的基础设施。
当前已上线的功能
- TinyHumans API – 已上线,访问地址为 tinyhumans.ai。提供按使用付费的 Python SDK、其他语言的 REST API,以及 LangChain、CrewAI、LlamaIndex 的集成。
- Alpha Human beta – 将于周三开放。可通过发送邮件至 founders@tinyhumans.ai 或加入我们的 Discord 申请早期访问。
试一试
pip install tinyhumansai如果遇到任何阻力,欢迎加入我们的 Discord 讨论。我们还会向任何构建出有趣作品并分享成果的人免费赠送 API 积分——请在 https://x.com/tinyhumansai 私信我们。