AI가 복잡해질수록 모델 빌더들은 NVIDIA에 의존한다
Source: NVIDIA AI Blog
사전 학습: 지능의 기반
AI 모델은 세 가지 스케일링 법칙—사전 학습, 사후 학습, 테스트‑타임 스케일링—덕분에 점점 더 강력해지고 있습니다. 추론 중에 연산을 적용해 여러 네트워크가 협력하여 복잡한 질의를 해결하는 추론 모델은 이제 어디서든 볼 수 있습니다.
하지만 사전 학습과 사후 학습은 여전히 지능의 기반입니다. 이 두 단계는 추론 모델을 더 똑똑하고 유용하게 만드는 핵심 요소입니다. 이를 달성하려면 규모가 필요합니다—프런티어 모델을 처음부터 훈련시키는 일은 작은 작업이 아닙니다. 수만 대, 심지어 수십만 대의 GPU가 효율적으로 협력해야 합니다.
이러한 규모는 여러 차원에서의 탁월함을 요구합니다: 세계 최고 수준의 가속기, 스케일‑업·스케일‑아웃·스케일‑어크로스 아키텍처를 아우르는 고급 네트워킹, 그리고 완전히 최적화된 소프트웨어 스택. 요컨대, 대규모 성능을 제공하도록 설계된 목적‑특화 인프라 플랫폼이 필요합니다.
NVIDIA Hopper 아키텍처와 비교했을 때, NVIDIA GB200 NVL72 시스템은 최신 MLPerf Training 산업 벤치마크에서 테스트된 가장 큰 모델에 대해 3배 빠른 훈련 성능을 제공했으며, 거의 2배 더 나은 성능 대비 비용을 달성했습니다 (source).
NVIDIA GB300 NVL72는 NVIDIA Hopper 대비 4배 이상의 속도 향상을 제공합니다 (MLPerf benchmarks).
이러한 성능 향상은 AI 개발자가 개발 주기를 단축하고 새로운 모델을 더 빠르게 배포하도록 돕습니다.
모든 모달리티에서 모델로 입증된 성과
오늘날 주요 대형 언어 모델 대부분은 NVIDIA 플랫폼에서 훈련되었습니다. AI는 텍스트에만 국한되지 않으며, NVIDIA는 음성, 이미지, 비디오 생성 및 생물학·로보틱스와 같은 신흥 분야에서도 개발을 지원합니다.
- Evo 2는 유전 서열을 디코딩합니다 (blog).
- OpenFold 3는 3D 단백질 구조를 예측합니다.
- Boltz‑2는 약물 상호작용을 시뮬레이션하여 연구자가 유망한 후보 물질을 더 빠르게 식별하도록 돕습니다.
임상 분야에서는 NVIDIA Clara 합성 모델이 현실적인 의료 영상을 생성해 환자 데이터를 노출하지 않고도 스크리닝 및 진단을 향상시킵니다.
Runway와 Inworld와 같은 기업은 NVIDIA 인프라에서 훈련합니다. Runway는 최근 Gen‑4.5를 발표했으며, 이는 프런티어 비디오‑생성 모델로 Artificial Analysis 리더보드 1위를 차지했습니다. NVIDIA Blackwell에 최적화된 Gen‑4.5는 연구, 사전 학습, 사후 학습 및 추론 전 단계에서 전적으로 NVIDIA GPU를 사용해 개발되었습니다.
Runway는 또한 GWM‑1을 선보였는데, 이는 NVIDIA Blackwell에서 훈련된 최첨단 일반 세계 모델로, 실시간으로 현실을 시뮬레이션하도록 설계되었습니다. 인터랙티브하고 제어 가능하며 범용적인 이 모델은 비디오 게임, 교육, 과학, 엔터테인먼트 및 로보틱스 등 다양한 분야에 활용될 수 있습니다.
벤치마크가 이를 입증합니다. 훈련 성능을 평가하는 산업 표준 벤치마크인 MLPerf는 NVIDIA의 폭넓은 역량을 보여줍니다. 최신 라운드에서 NVIDIA는 모든 7개의 MLPerf Training 5.1 벤치마크에 걸쳐 결과를 제출했으며 (details), 강력한 성능과 다재다능함을 입증했습니다. 이는 모든 카테고리에서 결과를 제출한 유일한 플랫폼이었습니다.
다양한 AI 워크로드를 지원하는 NVIDIA의 능력은 데이터 센터가 자원을 보다 효율적으로 활용하도록 돕습니다. Black Forest Labs, Cohere, Mistral, OpenAI, Reflection, Thinking Machines Lab 등 AI 연구소들이 모두 NVIDIA Blackwell 플랫폼에서 훈련하고 있습니다.
클라우드와 데이터 센터 전반에 걸친 NVIDIA Blackwell
NVIDIA Blackwell은 주요 클라우드 서비스 제공업체, 네오‑클라우드, 서버 제조업체를 통해 널리 제공됩니다. 추가적인 연산·메모리·아키텍처 개선을 제공하는 NVIDIA Blackwell Ultra는 현재 서버 제조업체와 클라우드 제공업체를 통해 순차적으로 출시되고 있습니다.
주요 클라우드 서비스 제공업체와 NVIDIA Cloud Partners인 Amazon Web Services, CoreWeave, Google Cloud, Lambda, Microsoft Azure, Nebius, Oracle Cloud Infrastructure, Together AI 등은 이미 NVIDIA Blackwell 기반 인스턴스를 제공하고 있어, 사전 학습 스케일링이 지속되는 한 확장 가능한 성능을 보장합니다.
프런티어 모델부터 일상적인 AI까지, 미래는 NVIDIA 위에서 구축되고 있습니다.