Nvidia 的新 AI 框架训练 8B 模型,像专业人士一样管理工具
发布: (2025年12月4日 GMT+8 07:00)
2 分钟阅读
原文: VentureBeat
Source: VentureBeat
概览
Nvidia 与香港大学的研究人员发布了 Orchestrator,这是一款拥有 80 亿参数的模型,能够协调不同的工具和大型语言模型(LLM),以解决复杂问题。在实验中,Orchestrator 在成本更低的情况下实现了更高的准确率,展示了具备工具感知能力的 LLM 在高效问题求解方面的潜力。
关键要点
- Orchestrator 能调用外部工具(例如计算器、搜索 API),并将它们的输出与 LLM 推理相结合。
- 该框架采用两阶段训练流程:首先在合成数据上进行预训练,然后在真实任务上进行微调。
- 基准测试显示,与规模相近的基线 LLM 相比,在多步骤推理和代码生成任务上取得了显著提升。
- Nvidia 计划开源该框架,并提供模型库(model zoo),供开发者构建自定义的编排代理。
可用性
对于有兴趣进行实验的开发者,Nvidia 已在 GitHub 上发布了代码和模型权重,并提供了如何将自定义工具集成到 Orchestrator 流水线的文档。