NVIDIA DSX Air 通过加速仿真提升 AI 工厂的 Time to Token

发布: (2026年3月17日 GMT+8 04:00)
10 分钟阅读

Source: NVIDIA AI Blog

(请提供需要翻译的正文内容,我才能为您进行简体中文翻译。)

AI工厂 — 从数月到数天

在仿真中搭建 AI 工厂 的能力——将部署时间从数月缩短到数天——正在加速下一次工业革命。

亮点:GTC 2026

在旧金山的 GTC 2026 上,NVIDIA 创始人兼 CEO Jensen Huang 揭晓了 NVIDIA DSX Air

  • 它是什么: 一个用于 逻辑上 仿真 AI 工厂的 SaaS 平台。
  • 所属项目: NVIDIA DSX Sim,位于 DSX platform —— NVIDIA 为 AI 工厂提供的蓝图。

核心能力

能力细节
高保真数字孪生模拟 NVIDIA 硬件(GPU、SuperNIC、DPU、交换机)。
开放的 API 集成连接合作伙伴的存储、路由、安全、编排等解决方案。
全栈生态系统将 NVIDIA 基础设施与第三方技术结合,实现端到端仿真。

实际影响

  • 早期验证: 类似 CoreWeave 的公司使用 DSX Air 在硬件到达装卸码头之前,对环境进行建模和验证。
  • 生产速度: 将集成和故障排查转移到仿真中,可将 首次令牌时间 从数周或数月缩短到 数天甚至数小时,实现巨大的时间和成本节约。

工作原理 — 类比

想象一下将你的笔记本电脑镜像,以便设置一台新电脑。
在此情境下,“笔记本电脑”指的是一个 超大规模 AI 工厂,而“镜像”则是 完整的、高保真复制品,与生产环境一模一样。

为什么重要

对于争分夺秒上线新 AI 能力的运营商而言,先仿真后部署 是一次 变革性的转变——让 AI 工厂更快、更便宜、更可靠。

为整个生态系统构建平台

NVIDIA DSX Air 仿真平台让 AI 工厂生态系统中的每个参与者——服务器制造商、编排供应商、存储提供商和安全合作伙伴——能够在单一、可扩展的虚拟环境中 与 NVIDIA 基础设施并行 验证其解决方案。

为什么这很重要

利益相关者痛点DSX Air 的帮助方式
服务器制造商需要实体实验室来验证参考架构;企业 AI 工作负载高度定制。创建 数字孪生 的客户特定配置,运行软件栈测试,并在无需任何硬件的情况下交付验证的解决方案。
编排供应商必须在规模化环境中证明多租户、即插即用的 AI 服务。仿真完整的 多租户 RTX PRO Server 环境(例如 Netris 网络、Rafay 主机编排、Run:AI GPU 分配),在没有真实集群的情况下验证复杂工作流。
数据平台合作伙伴大型实体集群成本高,难以进行端到端 AI 工作流验证。在 DSX Air 中建模完整的 AI 流水线——如 VAST AI OS 视频检索增强生成——从 DataEngine 节点到前端搜索/摘要。
安全供应商需要严格的多租户、DPU 加速的隔离和威胁检测测试。运行 分布式防火墙、基于 AI 的威胁检测以及真实流量生成器(例如在 BlueField DPU 上的 Check Point、防御 AI Vision One、Keysight Cyperf),在客户特定的数字孪生中进行测试。

GTC 合作伙伴亮点

  • 服务器制造商 现在可以在不建设昂贵实验室的情况下验证参考设计。
  • 编排供应商 展示了完整仿真的多租户 RTX PRO Server 堆栈,Netris、Rafay 与 Run:AI 分别负责网络、主机编排和 GPU 调度。
  • 数据平台展示:在 DSX Air 仿真中运行了 VAST AI 操作系统的视频检索增强生成工作负载——DataEngine 节点处理并索引视频,前端提供搜索与摘要,整个流程端到端完成。
  • 安全演示:在模拟的 BlueField DPU 上运行 Check Point 的分布式防火墙,使用 TrendAI Vision One 进行威胁检测,Keysight Cyperf 生成流量,证明了多租户策略执行和漏洞检测,且无需任何实体部署。

结论

DSX Air 提供了一种完整、可扩展且具成本效益的方式,在触碰任何硬件之前,就能与 NVIDIA 计算、网络和软件一起验证解决方案。

使用新模型加速 Time‑to‑Token

NVIDIA DSX Air 不仅是部署加速器——它为 AI 工厂引入了一种全新的运营模型。

1. 在仿真中构建(第 1 天)

  • 全栈复现 – 网络、计算、存储、编排、安全和调度均按生产环境的配置进行设置。
  • 端到端验证 – 验证每个组件协同工作,提前发现问题,并确认预期行为。

2. 自信部署

  • 由于环境已经过测试,顺利上线的 可能性显著提升
  • Time‑to‑first‑token 缩短,让团队能够专注于运行工作负载,而不是排查基础设施问题。

3. 安全的变更管理(持续进行)

  • 长期仿真 充当沙箱,用于:
    • 测试升级
    • 演练维护窗口
    • 验证补丁
    • 预测运营影响
  • 只有在仿真成功后,变更才会应用到真实环境,最大化正常运行时间 并确保基础设施可用性。

这种生命周期方法展示了现代 AI 工厂如何 在保持可靠性的同时实现高效扩展

模拟 AI 工厂:现代 AI 基础设施的支柱

GTC 展示了仿真已不再是未来概念——它已成为 AI 基础设施部署和运营的核心。

  • NVIDIA DSX Air 让客户和合作伙伴在单一环境中模拟其 AI 工作负载的每个方面。
  • 好处包括:
    • 更快的部署周期
    • 在上线期间降低风险
    • 确保规模化的首日性能

采用 NVIDIA DSX Air 加速部署与仿真

Siam.AI,泰国最大的 AI 云服务提供商,借助 NVIDIA DSX Air 加速了其基础设施的部署。通过使用仿真,Siam.AI 在计划时间之前就采纳了 NVIDIA 的最佳实践,确保了首日的运营专长,并在物理硬件到达之前就在虚拟环境中验证了其架构。

同样,Hydra Host 正在使用 DSX Air 加速 Brokkr 的开发——这是一套用于裸金属 GPU 供应的 AI 工厂操作系统,支撑着全球数十个 GPU 部署。通过在生产上线前先在 DSX Air 中仿真完整堆栈环境,Hydra Host 能够在大规模的多样化网络和硬件配置下验证 Brokkr 的自动化和编排工作流。这种“先仿真后部署”的方法使 Hydra Host 能更快向客户交付已验证的基础设施,同时在全球 AI 需求增长的背景下将对现场系统的风险降至最低。

随着 AI 工厂规模和复杂度的提升,在硬件到达之前验证完整堆栈环境的能力将决定创新的速度。NVIDIA DSX Air 今日即可提供此能力,为组织提供通往首个令牌的最快路径,并在长期运营 AI 基础设施时提供更可靠的方式。

了解更多关于 NVIDIA DSX Air

0 浏览
Back to Blog

相关文章

阅读更多 »

GTC 2026

!Nvidia GTC https://cdn.mos.cms.futurecdn.net/vRa45HowJkenVz8W9DP89g-1200-80.jpg 图片来源:Shutterstock 活动概览:最大的开发者人工智能…