NVIDIA 推出全新开放模型、数据和工具,推动 AI 在各行业的进步
Source: NVIDIA AI Blog
(请提供需要翻译的正文内容,我将为您翻译成简体中文。)
NVIDIA 扩展开放模型宇宙
NVIDIA 今日宣布一套全新的开放模型、数据和工具,旨在加速 AI 在各行业的落地。
开放模型
| 模型 | 关注领域 | 链接 |
|---|---|---|
| NVIDIA Nemotron | Agentic AI(代理式 AI) | Nemotron family |
| NVIDIA Cosmos | 物理 AI(仿真、数字孪生等) | Cosmos platform |
| NVIDIA Alpamayo | 自动驾驶汽车开发 | Alpamayo family |
| NVIDIA Isaac GR00T | 机器人技术 | Isaac GR00T |
| NVIDIA Clara | 生物医学与医疗健康 | Clara |
这些模型为企业提供构建真实世界 AI 系统所需的基础模块。
开源资源与数据
- 训练框架 – 完全开源,可随意定制。
- 多模态数据集 – 全球最大规模之一,包含:
- 10 万亿 语言训练 token
- 500,000 机器人轨迹
- 455,000 蛋白质结构
- 100 TB 车辆传感器数据
如此前所未有的多样化、开放资源规模,加速了语言模型、机器人、科学研究和自动驾驶汽车等领域的创新。
早期采用者
已有多家领先科技公司在 NVIDIA 的开放模型生态系统上开展建设,包括:
- Bosch
- CodeRabbit
- CrowdStrike
- Cohesity
- Fortinet
- Franka Robotics
- Humanoid
- Palantir
- Salesforce
- ServiceNow
- Hitachi
- Uber
欲了解更多细节,请浏览上述链接资源。
Source:
NVIDIA Nemotron 为 AI 代理带来语音、多模态智能和安全
在最近发布的 NVIDIA Nemotron 3 开源模型和数据系列的基础上,NVIDIA 正在发布用于 语音、多模态检索增强生成(RAG) 和 安全 的 Nemotron 模型。
Nemotron Speech
- 模型:
nemotron-speech-realtime-en-600m– 在实时英文语音方面领跑排行榜的开源模型。 - ASR 变体:
nemotron-speech-streaming-en-0.6b– 低延迟流式语音转文本,适用于实时字幕和语音 AI 应用。 - 性能: Daily 和 Modal 基准测试显示,其推理速度 约快 10 倍 于同类竞争模型。完整基准细节请参见此处。
Nemotron RAG
- 集合: Nemotron RAG – 用于检索增强生成的视觉‑语言模型套件。
- 嵌入模型:
llama-nemotron-embed-vl-1b-v2– 多语言、多模态嵌入。 - 重排模型:
llama-nemotron-rerank-vl-1b-v2– 用于文档搜索和信息检索的高精度重排。
Nemotron Safety
- 内容安全模型:
Llama-3.1-Nemotron-Safety-Guard-8B-v3– 扩展语言支持,确保安全的 AI 交互。 - PII 检测:
gliner-PII– 基于 GLiNER 的模型,能够高精度检测个人身份信息。
早期采用者
| 公司 | 用例 | 备注 |
|---|---|---|
| Bosch | Nemotron Speech | 使驾驶员能够通过语音与车辆交互。 |
| ServiceNow | 训练 Apriel 模型 | 使用包括 Nemotron 在内的开放数据集,实现成本高效的多模态性能。 |
| Cadence, IBM | Nemotron RAG | 试点在复杂技术文档中的改进搜索和推理。 |
| CrowdStrike, Cohesity, Fortinet | Nemotron Safety | 加强 AI 应用的可信度。 |
| Palantir | 本体框架 | 将 Nemotron 模型集成到统一的 AI‑agent 堆栈中。 |
| CodeRabbit | AI 代码审查 | 为可扩展、精准的代码审查流水线提供动力(demo)。 |
开发者资源
数据集与训练代码
- Embed Nemotron v1 数据集 – https://huggingface.co/datasets/nvidia/embed-nemotron-dataset-v1
- 训练代码(双编码器示例) – https://github.com/NVIDIA-NeMo/Automodel/tree/main/examples/biencoder
- 用于 Llama Embed Nemotron 8B 模型:https://huggingface.co/nvidia/llama-embed-nemotron-8b(MMTEB 排行榜条目)。
- Granary 数据集 – https://huggingface.co/datasets/nvidia/Granary
- 用于构建新的 Nemotron Speech ASR 模型。
工具
- LLM Router – 更新版,向开发者展示如何自动将 AI 请求路由到最合适的模型。https://build.nvidia.com/nvidia/llm-router
这些开源资产,加上 Nemotron 模型系列,为构建支持语音的多模态安全 AI 代理提供了完整的技术栈。
Source: …
每种物理 AI 与机器人模型全新发布
为机器人和自主系统开发物理 AI 需要庞大且多样化的数据集和模型,这些模型必须能够在复杂的真实世界环境中 感知、推理 和 行动。在 Hugging Face 上,机器人是增长最快的细分领域,NVIDIA 的开源机器人模型和数据集位居平台下载榜首——详见 AI World 故事。
NVIDIA Cosmos 基础模型
NVIDIA 正在发布 NVIDIA Cosmos 开放世界基础模型,为加速物理 AI 的研发与验证提供类人推理和世界生成能力。
| 模型 | 描述 | 关键链接 |
|---|---|---|
| Cosmos Reason 2 | 在机器人和 AI 代理领域排名领先的推理 VLM | • GitHub • Leaderboard |
| Cosmos Transfer 2.5 | 在多样化环境中生成大规模合成视频 | • GitHub |
| Cosmos Predict 2.5 | 预测未来帧和动力学,实现稳健的仿真与规划 | • GitHub • Benchmark leaderboard |
基于 Cosmos 构建的开源模型与蓝图
- Isaac GR00T N1.6 – 为类人机器人专门打造的开放式推理视觉‑语言‑动作(VLA)模型。它解锁全身控制,并利用 Cosmos Reason 实现更丰富的上下文理解。 → GitHub repo
- NVIDIA 视频搜索与摘要蓝图 – 属于 NVIDIA Metropolis 平台的参考工作流,使视觉 AI 代理能够分析海量录制和实时视频,提升运营效率与公共安全。 → Blueprint page
使用 Cosmos Reason 的公司
- Salesforce、Milestone、Hitachi、Uber、VAST Data、Encord – 利用 Cosmos Reason 开发交通管理和工作场所生产力 AI 代理。
- Franka Robotics、Humanoid、NEURA Robotics – 部署 Isaac GR00T 在生产前对新机器人行为进行仿真、训练和验证。
“Cosmos Reason 正在赋能新一代 AI 代理,使其能够以空前的精度理解并在物理世界中行动。” – NVIDIA AI Research
所有链接截至 2026 年 1 月 为止均为最新。
NVIDIA Alpamayo 用于基于推理的自动驾驶汽车
开发安全、可扩展的自动驾驶依赖于能够在复杂真实环境中 感知、推理和行动 的 AI。NVIDIA 正在发布 NVIDIA Alpamayo,这是一套全新的开源模型、仿真工具和大型数据集,旨在推动基于推理的自动驾驶汽车研发。
- Alpamayo 1 – 首个面向自动驾驶车辆的开源大规模推理 VLA 模型。它使车辆能够理解周围环境并解释其行为。
- AlpaSim – 用于闭环训练和评估基于推理的 AV 模型的开源仿真框架,支持多样化环境和边缘案例。
- Physical AI Open Datasets – https://huggingface.co/datasets/nvidia/PhysicalAI-Autonomous-Vehicles 包含 > 1,700 小时 的驾驶数据,覆盖广泛的地理位置和条件,包括对推理架构至关重要的罕见边缘案例。
NVIDIA Clara 医疗保健与生命科学
- La‑Proteina – 设计大型、原子级精确的蛋白质,用于研究和药物候选物开发。
- ReaSyn v2 – 将制造蓝图整合到 AI 设计的药物中,以确保实际合成。
- KERMT – 通过预测药物与人体的相互作用,在开发早期提供高精度的计算安全性测试。
- RNAPro – 预测 RNA 分子的复杂三维结构,释放个性化医学的潜力。
NVIDIA 还发布了一个包含 455 000 个合成蛋白质结构 的数据集,帮助 AI 研究人员构建更精确的模型。请参阅 arXiv 上的论文。
开始使用 NVIDIA 开放模型和技术
NVIDIA 的开放模型、数据和框架现已在以下平台提供:
- GitHub
- Hugging Face
- 各种云、推理和 AI‑基础设施平台
- build.nvidia.com
这些模型中的许多也以 NVIDIA NIM 微服务 形式提供,可在任何 NVIDIA 加速的基础设施上实现安全、可扩展的部署——从边缘到云端。
通过观看 NVIDIA Live at CES 了解更多。