[Paper] ToolRosetta：通过自动化工具标准化连接开源仓库与大型语言模型代理

发布: 1天前 (2026年3月10日 GMT+8 15:19)

8 分钟阅读

原文: arXiv

Source: arXiv - 2603.09290v1

Overview

ToolRosetta 解决了许多开发者深有体会的痛点：将庞大且多样的开源代码库转化为可靠的即插即用服务，以供大型语言模型（LLM）代理调用。通过自动将代码仓库和 API 转换为兼容 Model Context Protocol（MCP）的工具，框架使得基于 LLM 的代理能够几乎无需人工策划地组装并运行工具链，从而显著降低了复用现有代码的工作量。

关键贡献

完全自动化的工具标准化 – 将任意开源项目转换为 MCP 服务，无需手动包装。
端到端任务规划 – 在给定自然语言请求的情况下，系统会发现相关代码，构建工具链并执行。
内置安全检查 – 静态分析和沙箱机制防止恶意或不安全的代码执行。
可扩展评估 – 展示了在科学、数据处理和工程等领域对数千个工具的自动标准化。
对 LLM 代理的性能提升 – 在利用生成的工具时，显示出相较于商业 LLM 和先前代理框架的一致性提升。

方法论

仓库挖掘 – ToolRosetta 爬取流行的开源托管平台（例如 GitHub、GitLab），并根据与用户查询的相关性提取候选项目。
接口提取 – 通过静态分析和轻量级类型推断，系统识别入口点（函数、CLI 命令、REST 端点），这些入口点可以被暴露为服务。
MCP 包装器生成 – 对每个入口点，自动生成符合模型上下文协议（Model Context Protocol）的薄适配器，处理输入验证、序列化和响应格式化。
安全层 – 部署前，代码会进行沙箱执行、依赖审查以及一系列基于规则的检查（例如网络访问、文件系统写入）。检测到的风险要么自动缓解，要么标记为需要人工审查。
任务驱动规划 – 大语言模型（LLM）接收用户的自然语言任务，查询内部工具注册表，并构造一系列 MCP 调用（即“工具链”）以完成目标。随后逐步执行该计划，LLM 解释中间结果并在必要时调整计划。

整个流水线由轻量级编排引擎 orchestrate，能够按需启动 Docker 容器或无服务器函数，使生成的服务能够即时调用。

结果与发现

指标	基线（手动工具策划）	ToolRosetta（自动）
每个领域发现的可用工具数量	~30–50	≈ 1,200（≈ 25× 增长）
使工具达到 MCP‑ready 所需的人力（工时）	每个工具 2–4 小时	< 5 分钟（自动）
端到端任务成功率（复杂科学流水线）	62 %	81 %
平均任务完成时间	45 秒	31 秒（得益于并行工具执行）
安全事件（沙箱违规）	0（手动审查）	0（自动检查拦截所有问题）

要点：自动化流水线不仅显著扩大了工具库存，还转化为任务成功率和延迟方面的可量化提升。当相同任务交给商业 LLM 代理（例如基于 GPT‑4 的助手）且未使用 ToolRosetta 的工具增强时，成功率下降了 12–18 %。

实际影响

快速原型 – 开发者可以让 LLM “运行气候模型校准”，并立即获得一个即用的工具链，该工具链会拉取最新的开源气候库，进行配置并执行工作流。
企业知识库 – 公司可以导入内部代码库，自动将其公开为 MCP 服务，并让内部 LLM 助手在无需编写自定义包装器的情况下进行编排。
降低 DevOps 开销 – 沙箱部署模型消除了为每个第三方工具单独设置 CI 流水线的需求；框架能够即时处理容器化。
安全优先的集成 – 通过嵌入静态分析和运行时沙箱，组织可以安全地向生产级 LLM 代理公开社区代码，降低供应链风险。
生态系统增长 – ToolRosetta 可以充当“店面”，任何开源项目都能被 AI 代理即时发现并调用，促进 AI 驱动工具服务的新市场。

限制与未来工作

依赖复杂性 – 对于具有大量本机依赖（例如 GPU 加速库）的项目，仍需手动调优环境；当前沙箱无法保证所有此类情况的可复现性。
语义理解 – 静态分析可能会遗漏细微的运行时需求（例如特定配置文件），导致偶尔出现执行失败，需要人工调试。
安全检查的可扩展性 – 虽然对评估语料库有效，但基于规则的检查可能需要演进，以跟上更大、更多样化代码库中新出现的攻击向量。
未来方向 – 作者计划集成动态分析以更好地推断运行时约束，扩展对容器编排平台（Kubernetes、Cloud Run）的支持，并探索基于强化学习的规划，以进一步改进工具链选择。

ToolRosetta 证明了“寻找并封装”开源工具的瓶颈可以在规模上得到解决，为能够真正利用全球代码的 LLM 代理打开了大门，而无需大量手动工程工作。

作者

Shimin Di
Xujie Yuan
Hanghui Guo
Chaoqian Ouyang
Zhangze Chen
Ling Yue
Libin Zheng
Jia Zhu
Shaowu Pan
Jian Yin
Min-Ling Zhang
Yong Rui

论文信息

arXiv ID: 2603.09290v1
分类: cs.SE, cs.CE, cs.MA
出版日期: 2026年3月10日
PDF: 下载 PDF

[Paper] ToolRosetta：通过自动化工具标准化连接开源仓库与大型语言模型代理

Overview

关键贡献

方法论

结果与发现

实际影响

限制与未来工作

作者

论文信息

相关文章

[Paper] 为 AI 驱动的敏捷开发培养学生：基于项目的 AI 工程课程

[Paper] EmbC-Test：如何使用 LLMs 和 RAG 加速嵌入式软件测试

[Paper] 面向视点中心的工件化监管需求工程，实现设计合规

[Paper] SCAFFOLD-CEGIS：防止在 LLM 驱动的迭代代码细化中出现潜在的安全退化