新框架让 AI 代理在不重新训练底层模型的情况下重写自己的技能

发布: (2026年4月9日 GMT+8 01:18)
10 分钟阅读
原文: VentureBeat

Source: VentureBeat

请提供您希望翻译的正文内容,我将为您翻译成简体中文,并保持原有的格式、Markdown 语法以及技术术语不变。

部署自主代理的一个主要挑战

构建能够在重新训练底层大型语言模型(LLMs)的情况下适应环境变化的系统,是一个关键瓶颈。

Memento‑Skills 是由多所大学的研究人员开发的全新框架,它通过赋予代理自行发展技能的能力来解决此问题。

“它将持续学习能力加入了当前市场上已有的产品,如 OpenClaw 和 Claude Code,” — Jun Wang,论文共同作者,对 VentureBeat 说道。

Memento‑Skills 充当一个不断演进的外部记忆,使系统能够在不修改底层模型的前提下逐步提升其能力。该框架提供了一套技能,能够在代理从环境中获取反馈时更新和扩展

对于在生产环境中运行代理的企业团队而言,这一点至关重要。另一种做法——微调模型权重或手动构建技能——会带来大量的运营开销和数据需求。Memento‑Skills 绕过了这两者。

构建自我进化代理的挑战

  1. 冻结的语言模型

    • 一旦部署,模型的参数保持不变,这限制了它只能使用训练期间编码的知识以及其即时上下文窗口中能够容纳的内容。
  2. 需要外部记忆

    • 外部记忆支撑结构使得在无需昂贵且缓慢的重新训练过程的情况下实现改进。
  3. 当前的适应方法

    • 严重依赖手工设计的技能
    • 自动技能学习方法常常生成仅文本的指南,等同于提示优化。
    • 有些方法仅记录单任务轨迹,无法在任务之间迁移。
  4. 检索的局限性

    • 代理通常使用语义相似度路由器(例如密集嵌入)。
    • 高语义重叠并保证行为效用。

    “大多数检索增强生成(RAG)系统依赖基于相似度的检索。然而,当技能以可执行的工件形式呈现,如 markdown 文档或代码片段时,仅靠相似度可能无法选择最有效的技能,” – Wang

Source:

如何使用 Memento‑Skills 存储和更新技能

技能表示

  • 格式: 结构化的 markdown 文件,作为代理不断演化的知识库。
  • 每个可复用技能工件的核心要素:
    1. 声明式规范 – 说明技能是什么以及如何使用。
    2. 专用指令和提示 – 引导 LLM 的推理。
    3. 可执行代码 & 辅助脚本 – 实际实现任务的代码。

持续学习机制

  • 读写反思学习 – 将记忆更新视为主动的策略迭代,而非被动记录。
  • 工作流:
    1. 查询 专门的 skill router,检索最 行为相关 的技能(而非仅语义相似的技能)。
    2. 执行 该技能并获取反馈。
    3. 反思 结果:
      • 若执行失败,编排器会评估执行轨迹并 重写 技能工件(代码或提示)。
      • 如有必要,从头创建新技能

Skill Router 训练

  • 通过 一步离线强化学习 过程进行更新,学习依据是执行反馈而非文本重叠。

“技能的真正价值在于它对整体代理工作流和下游执行的贡献,” – Wang。
“因此,强化学习提供了更合适的框架,因为它使代理能够基于长期效用评估和选择技能。”

安全防护

  • 自动单元测试门禁:
    • 生成合成测试用例。
    • 对更新后的技能执行该测试。
    • 仅在测试通过时才保存更改,防止生产环境回归。

通过持续重写和优化自身的可执行工具,Memento‑Skills 使冻结的 LLM 能够构建稳固的“肌肉记忆”,并端到端逐步扩展其能力。

将自我进化代理置于测试

基准

基准描述
General AI Assistants (GAIA)需要复杂的多步骤推理、多模态处理、网页浏览和工具使用。
Humanity’s Last Exam (HLE)覆盖八个多样化学科(例如数学、生物学)的专家级基准。
  • 底层模型: Gemini‑3.1‑Flash(冻结)。

基线

  • 读写基线: 检索技能并收集反馈,但缺乏自我进化特性。
  • 技能路由基线: 标准语义检索方法,包括 BM25Qwen‑3 embeddings

结果

  • 主动自我进化记忆 在高度多样的 GAIA 基准上远超 静态技能库(为简洁起见省略细节)。

Memento‑Skills 性能亮点

  • 测试集准确率: Memento‑Skills 将准确率提升了 13.7 pp,达到 66.0 %,相较基线的 52.3 %
  • HLE 基准: 受益于大规模跨任务技能复用,性能提升超过一倍,从 17.9 % 跃升至 38.7 %

技能路由器优势

专用的技能路由器避免了经典的 检索陷阱——仅因语义相似而选择不相关的技能。实验表明:

  • 端到端任务成功率: Memento‑Skills 为 80 %,而标准 BM25 检索为 50 %

有机、结构化的技能增长

基准种子技能(初始)最终技能库
GAIA5 个原子技能(例如基础网页搜索、终端操作)41 个紧凑技能
HLE5 个原子技能235 个不同技能

两个基准均仅从五个原子种子技能开始,随后自主扩展至上述数量。

Source:

寻找企业最佳切入点

Memento‑Skills 的代码已在 GitHub 上公开,可直接使用。

企业架构师的关键考虑因素

  1. 领域对齐 – 效果取决于代理任务与业务领域的匹配程度。
  2. 任务结构
    • 孤立/弱相关任务:代理必须从头学习,跨任务的迁移有限。
    • 结构化、相关任务:先前的技能可以直接复用,使学习效率大幅提升。

“技能迁移取决于任务之间的相似程度,” Wang 说。“当任务共享大量结构时,先前获得的技能可以直接复用,使代理能够在几乎无需额外交互的情况下,在新问题上表现良好。”

推荐的部署场景

  • 工作流 – 最合适的场景;它们提供结构化环境,便于组合、评估和改进技能。
  • 实体代理 – 仍然大多未被探索,需要进一步研究。
  • 长时程任务 – 可能需要更高级的方法(例如多代理 LLM 系统)来实现协同、规划和持续执行。

治理与安全

  • 安全轨道 – Memento‑Skills 已经包含自动单元测试门。
  • 评估框架 – 需要一个综合的评审系统来评估性能并提供一致的指导。

“为了实现可靠的自我改进,我们需要一个设计良好的评估或评审系统,能够评估性能并提供一致的指导,”Wang 指出。“与其允许不受约束的自我修改,不如将过程结构化为一种受引导的自我发展形式,让反馈引导代理朝着更好的设计前进。”

0 浏览
Back to Blog

相关文章

阅读更多 »