Nvidia 的新 AI 框架训练 8B 模型,像专业人士一样管理工具

发布: (2025年12月4日 GMT+8 07:00)
2 min read

Source: VentureBeat

Overview

Nvidia 与香港大学的研究人员发布了 Orchestrator,这是一款拥有 80 亿参数的模型,能够协调不同的工具和大型语言模型(LLM),以解决复杂问题。在实验中,Orchestrator 在成本更低的情况下实现了比更大模型更高的准确率,展示了具备工具感知能力的 LLM 在高效问题求解方面的潜力。

Key Points

  • Orchestrator 能调用外部工具(例如计算器、搜索 API),并将它们的输出与 LLM 推理相结合。
  • 该框架采用两阶段训练流程:首先在合成数据上进行预训练,然后在真实任务上进行微调。
  • 基准测试显示,与同等规模的基线 LLM 相比,在多步推理和代码生成任务上取得了显著提升。
  • Nvidia 计划开源该框架,并提供模型仓库,供开发者构建自定义的编排代理。

Training Process

训练流水线包括:

  1. 预训练:在合成数据上训练模型,以教授其如何与工具交互。
  2. 微调:在真实任务上进行微调,使模型能够在实际场景中应用工具。

Benchmarks

实验表明,Orchestrator 在以下方面优于同等规模的基线 LLM:

  • 多步推理任务
  • 代码生成任务

Open‑Source Release

对于有兴趣进行实验的开发者,Nvidia 已在 GitHub 上发布了代码和模型权重,并提供了如何将自定义工具集成到 Orchestrator 流水线中的文档。

Back to Blog

相关文章

阅读更多 »