NVIDIA 推出全新开放模型、数据和工具,推动 AI 在各行业的进步

发布: (2026年1月6日 GMT+8 05:50)
9 min read

Source: NVIDIA AI Blog

(请提供需要翻译的正文内容,我将为您翻译成简体中文。)

NVIDIA 扩展开放模型宇宙

NVIDIA 今日宣布一套全新的开放模型、数据和工具,旨在加速 AI 在各行业的落地。

开放模型

模型关注领域链接
NVIDIA NemotronAgentic AI(代理式 AI)Nemotron family
NVIDIA Cosmos物理 AI(仿真、数字孪生等)Cosmos platform
NVIDIA Alpamayo自动驾驶汽车开发Alpamayo family
NVIDIA Isaac GR00T机器人技术Isaac GR00T
NVIDIA Clara生物医学与医疗健康Clara

这些模型为企业提供构建真实世界 AI 系统所需的基础模块。

开源资源与数据

  • 训练框架 – 完全开源,可随意定制。
  • 多模态数据集 – 全球最大规模之一,包含:
    • 10 万亿 语言训练 token
    • 500,000 机器人轨迹
    • 455,000 蛋白质结构
    • 100 TB 车辆传感器数据

如此前所未有的多样化、开放资源规模,加速了语言模型、机器人、科学研究和自动驾驶汽车等领域的创新。

早期采用者

已有多家领先科技公司在 NVIDIA 的开放模型生态系统上开展建设,包括:

  • Bosch
  • CodeRabbit
  • CrowdStrike
  • Cohesity
  • Fortinet
  • Franka Robotics
  • Humanoid
  • Palantir
  • Salesforce
  • ServiceNow
  • Hitachi
  • Uber

欲了解更多细节,请浏览上述链接资源。

Source:

NVIDIA Nemotron 为 AI 代理带来语音、多模态智能和安全

在最近发布的 NVIDIA Nemotron 3 开源模型和数据系列的基础上,NVIDIA 正在发布用于 语音多模态检索增强生成(RAG)安全 的 Nemotron 模型。

Nemotron Speech

  • 模型: nemotron-speech-realtime-en-600m – 在实时英文语音方面领跑排行榜的开源模型。
  • ASR 变体: nemotron-speech-streaming-en-0.6b – 低延迟流式语音转文本,适用于实时字幕和语音 AI 应用。
  • 性能: Daily 和 Modal 基准测试显示,其推理速度 约快 10 倍 于同类竞争模型。完整基准细节请参见此处

Nemotron RAG

Nemotron Safety

早期采用者

公司用例备注
BoschNemotron Speech使驾驶员能够通过语音与车辆交互。
ServiceNow训练 Apriel 模型使用包括 Nemotron 在内的开放数据集,实现成本高效的多模态性能。
Cadence, IBMNemotron RAG试点在复杂技术文档中的改进搜索和推理。
CrowdStrike, Cohesity, FortinetNemotron Safety加强 AI 应用的可信度。
Palantir本体框架将 Nemotron 模型集成到统一的 AI‑agent 堆栈中。
CodeRabbitAI 代码审查为可扩展、精准的代码审查流水线提供动力(demo)。

开发者资源

数据集与训练代码

工具

这些开源资产,加上 Nemotron 模型系列,为构建支持语音的多模态安全 AI 代理提供了完整的技术栈。

Source:

每种物理 AI 与机器人模型全新发布

为机器人和自主系统开发物理 AI 需要庞大且多样化的数据集和模型,这些模型必须能够在复杂的真实世界环境中 感知推理行动。在 Hugging Face 上,机器人是增长最快的细分领域,NVIDIA 的开源机器人模型和数据集位居平台下载榜首——详见 AI World 故事

NVIDIA Cosmos 基础模型

NVIDIA 正在发布 NVIDIA Cosmos 开放世界基础模型,为加速物理 AI 的研发与验证提供类人推理和世界生成能力。

模型描述关键链接
Cosmos Reason 2在机器人和 AI 代理领域排名领先的推理 VLMGitHub
Leaderboard
Cosmos Transfer 2.5在多样化环境中生成大规模合成视频GitHub
Cosmos Predict 2.5预测未来帧和动力学,实现稳健的仿真与规划GitHub
Benchmark leaderboard

基于 Cosmos 构建的开源模型与蓝图

  • Isaac GR00T N1.6 – 为类人机器人专门打造的开放式推理视觉‑语言‑动作(VLA)模型。它解锁全身控制,并利用 Cosmos Reason 实现更丰富的上下文理解。 → GitHub repo
  • NVIDIA 视频搜索与摘要蓝图 – 属于 NVIDIA Metropolis 平台的参考工作流,使视觉 AI 代理能够分析海量录制和实时视频,提升运营效率与公共安全。 → Blueprint page

使用 Cosmos Reason 的公司

  • SalesforceMilestoneHitachiUberVAST DataEncord – 利用 Cosmos Reason 开发交通管理和工作场所生产力 AI 代理。
  • Franka RoboticsHumanoidNEURA Robotics – 部署 Isaac GR00T 在生产前对新机器人行为进行仿真、训练和验证。

“Cosmos Reason 正在赋能新一代 AI 代理,使其能够以空前的精度理解并在物理世界中行动。” – NVIDIA AI Research

所有链接截至 2026 年 1 月 为止均为最新。

NVIDIA Alpamayo 用于基于推理的自动驾驶汽车

开发安全、可扩展的自动驾驶依赖于能够在复杂真实环境中 感知、推理和行动 的 AI。NVIDIA 正在发布 NVIDIA Alpamayo,这是一套全新的开源模型、仿真工具和大型数据集,旨在推动基于推理的自动驾驶汽车研发。

  • Alpamayo 1 – 首个面向自动驾驶车辆的开源大规模推理 VLA 模型。它使车辆能够理解周围环境并解释其行为。
  • AlpaSim – 用于闭环训练和评估基于推理的 AV 模型的开源仿真框架,支持多样化环境和边缘案例。
  • Physical AI Open Datasetshttps://huggingface.co/datasets/nvidia/PhysicalAI-Autonomous-Vehicles 包含 > 1,700 小时 的驾驶数据,覆盖广泛的地理位置和条件,包括对推理架构至关重要的罕见边缘案例。

NVIDIA Clara 医疗保健与生命科学

  • La‑Proteina – 设计大型、原子级精确的蛋白质,用于研究和药物候选物开发。
  • ReaSyn v2 – 将制造蓝图整合到 AI 设计的药物中,以确保实际合成。
  • KERMT – 通过预测药物与人体的相互作用,在开发早期提供高精度的计算安全性测试。
  • RNAPro – 预测 RNA 分子的复杂三维结构,释放个性化医学的潜力。

NVIDIA 还发布了一个包含 455 000 个合成蛋白质结构 的数据集,帮助 AI 研究人员构建更精确的模型。请参阅 arXiv 上的论文。

开始使用 NVIDIA 开放模型和技术

NVIDIA 的开放模型、数据和框架现已在以下平台提供:

  • GitHub
  • Hugging Face
  • 各种云、推理和 AI‑基础设施平台
  • build.nvidia.com

这些模型中的许多也以 NVIDIA NIM 微服务 形式提供,可在任何 NVIDIA 加速的基础设施上实现安全、可扩展的部署——从边缘到云端。

通过观看 NVIDIA Live at CES 了解更多

Back to Blog

相关文章

阅读更多 »