[Paper] ToolOrchestra:通过高效模型和工具编排提升智能
Source: arXiv - 2511.21689v1
概览
大型语言模型是强大的通用模型,但解决诸如人类终极考试(Humanity’s Last Exam,HLE)等深层且复杂的问题仍然在概念上具有挑战性且计算成本高昂。我们展示了通过小型编排器管理其他模型和各种工具,既可以提升智能的上限,又能提高解决困难代理任务的效率。我们提出 ToolOrchestra,一种训练小型编排器以协同智能工具的方法。ToolOrchestra 明确使用包含结果、效率和用户偏好感知的奖励进行强化学习。借助 ToolOrchestra,我们生成了 Orchestrator,一个 8B 参数的模型,在成本更低的情况下实现了比以往工具使用代理更高的准确率,并且在给定查询时能够对使用哪些工具符合用户偏好。
在 HLE 上,Orchestrator 获得 37.1% 的得分,优于 GPT‑5(35.1%),且效率提升 2.5 倍。在 tau2‑Bench 和 FRAMES 上,Orchestrator 以约 30% 的成本大幅超越 GPT‑5。大量分析表明,Orchestrator 在多项指标下实现了性能与成本的最佳平衡,并且能够稳健地泛化到未见过的工具。这些结果表明,使用轻量级编排模型组合多样化工具比现有方法更高效、更有效,为实用且可扩展的工具增强推理系统铺平了道路。
作者
- Hongjin Su
- Shizhe Diao
- Ximing Lu
- Mingjie Liu
- Jiacheng Xu
- Xin Dong
- Yonggan Fu
- Peter Belcak
- Hanrong Ye
- Hongxu Yin
- Yi Dong
- Evelina Bakhturina
- Tao Yu
- Yejin Choi
- Jan Kautz
- Pavlo Molchanov
分类
- cs.CL
- cs.AI
- cs.LG
- cs.MA
论文信息
- arXiv ID: 2511.21689v1
- 发布日期: 2025 年 11 月 27 日
- PDF: Download PDF