[Paper] 递归多智能体系统

发布: 19小时前 (2026年4月29日 GMT+8 01:59)

7 分钟阅读

原文: arXiv

Source: arXiv - 2604.25917v1

概述

本文介绍了 RecursiveMAS，这是一种新颖的框架，将整个多智能体系统视为对潜在表征进行的单一递归计算。通过使用轻量级的 “RecursiveLink” 模块将智能体循环连接，作者展示了协作本身可以被扩展——类似于最近的 “循环” 语言模型，它们通过反复细化自身推理来提升性能。该系统能够更快地进行推理，使用更少的 token，并在广泛的任务上实现更高的准确率。

关键贡献

Recursive multi‑agent formulation – 将异构代理及其交互视为统一的潜在空间递归，实现代理之间的无缝状态转移。
RecursiveLink module – 一个轻量级连接器，生成分布内的潜在“思考”，并在代理之间传递，无需昂贵的文本生成。
Inner‑outer loop learning algorithm – 通过共享的基于梯度的信用分配联合优化所有代理和递归动力学，消除单独微调阶段的需求。
Theoretical analysis – 证明相较于传统基于文本的多代理流水线具有更低的运行时复杂度，并展示递归轮次中的梯度流稳定。
Extensive empirical validation – 在九个基准（数学、科学、医学、搜索、代码）上评估四种常见协作模式，报告平均 8.3 % 的准确率提升、1.2‑2.4× 的推理加速，以及相较于强基线 34.6‑75.6 % 的 token 使用量减少。

方法论

潜在空间递归 – 与其让代理交换原始文本，不如让每个代理生成一个紧凑的潜在向量（即它的“思考”）。这些向量通过 RecursiveLink 反馈回系统，形成一个闭环，可以迭代多次。
RecursiveLink 设计 – 一个小型神经模块，用于对齐一个代理的输出空间与下一个代理的输入空间，确保生成的潜在状态保持在代理训练时的分布范围内。
学习算法
- 内部循环：运行固定次数的递归步骤，传播潜在状态并收集任务特定的损失。
- 外部循环：在整个递归图上进行反向传播，同时为每个代理和 RecursiveLink 分配信用。
- 在递归步骤之间共享梯度，使更新保持稳定，避免梯度爆炸或消失。
协作模式 – 作者为四种典型设置（例如，规划者‑执行者、专家‑通用者、辩论以及层级监督）实现了 RecursiveMAS，以展示其灵活性。

结果与发现

基准类别	平均准确率提升	推理加速	令牌减少
Mathematics	+9.1 %	2.1×	68 %
Science & Medicine	+7.8 %	1.8×	55 %
Search & Retrieval	+8.5 %	1.5×	42 %
Code Generation	+8.2 %	1.2×	35 %

RecursiveMAS 始终优于 单代理递归模型 和 依赖完整文本交互的标准多代理流水线。
递归循环平均在 3‑5 次迭代 内收敛，表明加深推理并不需要大量的遍数。
梯度分析证实 在递归深度上保持稳定的范数，验证了内外循环的训练方案。

实际意义

降低 API 成本 – 通过在潜在空间中运行，RecursiveMAS 大幅减少 token 使用量，这直接转化为 OpenAI、Anthropic 等服务的使用费用降低。
更快的协作助手 – 实时工具（例如 AI 配对程序员、研究助理或医疗分诊机器人）现在可以在不受串行文本传递延迟影响的情况下协调多个专门模型。
模块化系统设计 – 团队可以插入已有的预训练代理（例如代码 LLM、检索模型、推理 LLM），让 RecursiveMAS 负责编排，简化工程流水线。
可扩展推理 – 递归机制提供了新的扩展旋钮：开发者无需训练更大的单体模型，只需通过增加递归步骤来加深推理，从而节省计算和内存。

限制与未来工作

递归深度权衡 – 虽然 3‑5 步在评估任务中表现良好，但更复杂的问题可能需要更深的循环，可能会重新引入梯度不稳定性。
异构性处理 – 当前的 RecursiveLink 假设潜在维度兼容；将其扩展到真正不同的模型架构（例如仅视觉的代理）需要额外的对齐机制。
基准范围 – 实验聚焦于结构良好的基准；真实世界的噪声环境（例如开放域对话）仍待测试。
未来方向 作者提出的包括：自适应递归调度（动态决定需要多少循环）、更丰富的跨模态潜在桥接，以及将 RecursiveMAS 应用于大规模分布式系统（例如边缘‑云协作）。

作者

Xiyuan Yang
Jiaru Zou
Rui Pan
Ruizhong Qiu
Pan Lu
Shizhe Diao
Jindong Jiang
Hanghang Tong
Tong Zhang
Markus J. Buehler
Jingrui He
James Zou

论文信息

arXiv ID: 2604.25917v1
分类: cs.AI, cs.CL, cs.LG
发表时间: 2026年4月28日
PDF: 下载 PDF

[Paper] 递归多智能体系统

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] 面向自然语言语义的函数式几何代数

[论文] RLHF 注释的三种模型：扩展、证据与权威

[Paper] Luminol-AIDetect：基于困惑度的文本洗牌下快速零样本机器生成文本检测

[论文] G-Loss：图引导的语言模型微调