[Paper] ToolRosetta:通过自动化工具标准化连接开源仓库与大型语言模型代理
发布: (2026年3月10日 GMT+8 15:19)
8 分钟阅读
原文: arXiv
Source: arXiv - 2603.09290v1
Overview
ToolRosetta 解决了许多开发者深有体会的痛点:将庞大且多样的开源代码库转化为可靠的即插即用服务,以供大型语言模型(LLM)代理调用。通过自动将代码仓库和 API 转换为兼容 Model Context Protocol(MCP)的工具,框架使得基于 LLM 的代理能够几乎无需人工策划地组装并运行工具链,从而显著降低了复用现有代码的工作量。
关键贡献
- 完全自动化的工具标准化 – 将任意开源项目转换为 MCP 服务,无需手动包装。
- 端到端任务规划 – 在给定自然语言请求的情况下,系统会发现相关代码,构建工具链并执行。
- 内置安全检查 – 静态分析和沙箱机制防止恶意或不安全的代码执行。
- 可扩展评估 – 展示了在科学、数据处理和工程等领域对数千个工具的自动标准化。
- 对 LLM 代理的性能提升 – 在利用生成的工具时,显示出相较于商业 LLM 和先前代理框架的一致性提升。
方法论
- 仓库挖掘 – ToolRosetta 爬取流行的开源托管平台(例如 GitHub、GitLab),并根据与用户查询的相关性提取候选项目。
- 接口提取 – 通过静态分析和轻量级类型推断,系统识别入口点(函数、CLI 命令、REST 端点),这些入口点可以被暴露为服务。
- MCP 包装器生成 – 对每个入口点,自动生成符合模型上下文协议(Model Context Protocol)的薄适配器,处理输入验证、序列化和响应格式化。
- 安全层 – 部署前,代码会进行沙箱执行、依赖审查以及一系列基于规则的检查(例如网络访问、文件系统写入)。检测到的风险要么自动缓解,要么标记为需要人工审查。
- 任务驱动规划 – 大语言模型(LLM)接收用户的自然语言任务,查询内部工具注册表,并构造一系列 MCP 调用(即“工具链”)以完成目标。随后逐步执行该计划,LLM 解释中间结果并在必要时调整计划。
整个流水线由轻量级编排引擎 orchestrate,能够按需启动 Docker 容器或无服务器函数,使生成的服务能够即时调用。
结果与发现
| 指标 | 基线(手动工具策划) | ToolRosetta(自动) |
|---|---|---|
| 每个领域发现的可用工具数量 | ~30–50 | ≈ 1,200(≈ 25× 增长) |
| 使工具达到 MCP‑ready 所需的人力(工时) | 每个工具 2–4 小时 | < 5 分钟(自动) |
| 端到端任务成功率(复杂科学流水线) | 62 % | 81 % |
| 平均任务完成时间 | 45 秒 | 31 秒(得益于并行工具执行) |
| 安全事件(沙箱违规) | 0(手动审查) | 0(自动检查拦截所有问题) |
要点:自动化流水线不仅显著扩大了工具库存,还转化为任务成功率和延迟方面的可量化提升。当相同任务交给商业 LLM 代理(例如基于 GPT‑4 的助手)且未使用 ToolRosetta 的工具增强时,成功率下降了 12–18 %。
实际影响
- 快速原型 – 开发者可以让 LLM “运行气候模型校准”,并立即获得一个即用的工具链,该工具链会拉取最新的开源气候库,进行配置并执行工作流。
- 企业知识库 – 公司可以导入内部代码库,自动将其公开为 MCP 服务,并让内部 LLM 助手在无需编写自定义包装器的情况下进行编排。
- 降低 DevOps 开销 – 沙箱部署模型消除了为每个第三方工具单独设置 CI 流水线的需求;框架能够即时处理容器化。
- 安全优先的集成 – 通过嵌入静态分析和运行时沙箱,组织可以安全地向生产级 LLM 代理公开社区代码,降低供应链风险。
- 生态系统增长 – ToolRosetta 可以充当“店面”,任何开源项目都能被 AI 代理即时发现并调用,促进 AI 驱动工具服务的新市场。
限制与未来工作
- 依赖复杂性 – 对于具有大量本机依赖(例如 GPU 加速库)的项目,仍需手动调优环境;当前沙箱无法保证所有此类情况的可复现性。
- 语义理解 – 静态分析可能会遗漏细微的运行时需求(例如特定配置文件),导致偶尔出现执行失败,需要人工调试。
- 安全检查的可扩展性 – 虽然对评估语料库有效,但基于规则的检查可能需要演进,以跟上更大、更多样化代码库中新出现的攻击向量。
- 未来方向 – 作者计划集成动态分析以更好地推断运行时约束,扩展对容器编排平台(Kubernetes、Cloud Run)的支持,并探索基于强化学习的规划,以进一步改进工具链选择。
ToolRosetta 证明了“寻找并封装”开源工具的瓶颈可以在规模上得到解决,为能够真正利用全球代码的 LLM 代理打开了大门,而无需大量手动工程工作。
作者
- Shimin Di
- Xujie Yuan
- Hanghui Guo
- Chaoqian Ouyang
- Zhangze Chen
- Ling Yue
- Libin Zheng
- Jia Zhu
- Shaowu Pan
- Jian Yin
- Min-Ling Zhang
- Yong Rui
论文信息
- arXiv ID: 2603.09290v1
- 分类: cs.SE, cs.CE, cs.MA
- 出版日期: 2026年3月10日
- PDF: 下载 PDF