掌握 AI 代理记忆:面向高级用户的架构
发布: (2026年2月25日 GMT+8 13:41)
3 分钟阅读
原文: Dev.to
Source: Dev.to
为什么记忆对 AI 代理很重要
没有记忆的 AI 代理就像失忆的人——它们无法从过去的交互中学习,无法适应新信息,也无法随时间保持上下文。对于高级用户来说,这意味着:
- 上下文保留 – 记住过去的交互以保持连续性。
- 经验学习 – 存储并检索相关数据,以改进未来的响应。
- 个性化 – 随着时间的推移适应用户的偏好和行为。
AI 代理记忆的核心组件
一个生产级的记忆架构通常由三层组成:
- 短期记忆 – 当前会话的活动上下文。
- 长期记忆 – 用于存放知识和经验的持久存储。
- 工作记忆 – 连接短期和长期记忆的混合层。
短期记忆:活动上下文
短期记忆保存当前的对话或任务上下文。它是易失的——会在会话结束时被清除,并且针对快速访问进行优化。
class ShortTermMemory:
def __init__(self):
self.context = []
def add(self, message):
self.context.append(message)
if len(self.context) > 10: # Limit context window
self.context.pop(0)
def get(self):
return self.context
关键考虑因素
- 上下文窗口大小 – 窗口太大性能受影响;窗口太小则会失去连续性。
- 相关性过滤 – 并非所有过去的消息都同等重要。使用嵌入向量对相关性进行排序。
长期记忆:知识库
长期记忆存储持久化数据,如用户偏好、过去的决策以及学习到的模式。这是 AI 从经验中“学习”的地方。
文件结构示例
memory/
├── user_preferences.json
├── interaction_history/
│ ├── 2023-10-01.json
│ ├── 2023-10-02.json
│ └── ...
└── knowledge_graph/
├── entities/
│ ├── projects/
│ └── contacts/
└── relationships.json
实现示例(JSON)
{
"user_preferences": {
"default_model": "gpt-4",
"workflow_preferences": {
"code_review": {
"strictness": "high",
"focus_areas": ["security", "performance"]
}
}
},
"interaction_history": [
{
"timestamp": "2023-10-01T12:00:00",
"user_id": "user123",
"session_id": "session456",
"messages": [...]
}
]
}
工作记忆:桥梁
工作记忆会动态地从长期记忆中提取相关数据并放入活动上下文。它是最复杂但也最强大的组件。
(为简洁起见,省略了进一步的实现细节。)