Nvidia 的新 AI 框架训练 8B 模型,像专业人士一样管理工具

发布: (2025年12月4日 GMT+8 07:00)
2 分钟阅读

Source: VentureBeat

概览

Nvidia 与香港大学的研究人员发布了 Orchestrator,这是一款拥有 80 亿参数的模型,能够协调不同的工具和大型语言模型(LLM),以解决复杂问题。在实验中,Orchestrator 在成本更低的情况下实现了更高的准确率,展示了具备工具感知能力的 LLM 在高效问题求解方面的潜力。

关键要点

  • Orchestrator 能调用外部工具(例如计算器、搜索 API),并将它们的输出与 LLM 推理相结合。
  • 该框架采用两阶段训练流程:首先在合成数据上进行预训练,然后在真实任务上进行微调。
  • 基准测试显示,与规模相近的基线 LLM 相比,在多步骤推理和代码生成任务上取得了显著提升。
  • Nvidia 计划开源该框架,并提供模型库(model zoo),供开发者构建自定义的编排代理。

可用性

对于有兴趣进行实验的开发者,Nvidia 已在 GitHub 上发布了代码和模型权重,并提供了如何将自定义工具集成到 Orchestrator 流水线的文档。

Back to Blog

相关文章

阅读更多 »

2025-12-07 每日 AI 新闻

模型竞争与研究突破——据报道,OpenAI 正在加速发布 GPT‑5.2,以对抗 Google 的 Gemini 3,强调更强的推理,spe...