Nvidia 的新 AI 框架训练 8B 模型，像专业人士一样管理工具

发布: 2个月前 (2025年12月4日 GMT+8 07:00)

2 分钟阅读

Source: VentureBeat

概览

Nvidia 与香港大学的研究人员发布了 Orchestrator，这是一款拥有 80 亿参数的模型，能够协调不同的工具和大型语言模型（LLM），以解决复杂问题。在实验中，Orchestrator 在成本更低的情况下实现了更高的准确率，展示了具备工具感知能力的 LLM 在高效问题求解方面的潜力。

关键要点

Orchestrator 能调用外部工具（例如计算器、搜索 API），并将它们的输出与 LLM 推理相结合。
该框架采用两阶段训练流程：首先在合成数据上进行预训练，然后在真实任务上进行微调。
基准测试显示，与规模相近的基线 LLM 相比，在多步骤推理和代码生成任务上取得了显著提升。
Nvidia 计划开源该框架，并提供模型库（model zoo），供开发者构建自定义的编排代理。

可用性

对于有兴趣进行实验的开发者，Nvidia 已在 GitHub 上发布了代码和模型权重，并提供了如何将自定义工具集成到 Orchestrator 流水线的文档。

Nvidia 的新 AI 框架训练 8B 模型，像专业人士一样管理工具

概览

关键要点

可用性

相关文章

据报道，SoftBank 与 Nvidia 正在洽谈以 140 亿美元为 Skild AI 提供资金，几乎使其价值翻三倍

参议院的新《SAFE法案》将限制中国获取先进芯片，但这不会减缓AI战争——训练工作负载仍高度依赖Nvidia，而替代方案仍效率低下

2025-12-07 每日 AI 新闻

从基础到突破：我在 Kaggle Google AI Agents 强化训练中的旅程