NVIDIA, 모든 산업에 걸친 AI 발전을 위한 새로운 오픈 모델, 데이터 및 도구 공개
Source: NVIDIA AI Blog
번역할 전체 텍스트를 제공해 주시겠어요? 현재는 소스 링크만 포함되어 있어 번역할 내용이 없습니다. 텍스트를 알려주시면 한국어로 번역해 드리겠습니다.
NVIDIA는 Open‑Model 우주를 확장합니다
NVIDIA는 오늘 모든 산업 분야에서 AI 도입을 가속화하기 위해 새로운 오픈 모델, 데이터 및 도구 모음을 발표했습니다.
오픈 모델
| 모델 | 초점 | 링크 |
|---|---|---|
| NVIDIA Nemotron | 에이전시 AI | Nemotron family |
| NVIDIA Cosmos | 물리 AI (시뮬레이션, 디지털 트윈 등) | Cosmos platform |
| NVIDIA Alpamayo | 자율주행 차량 개발 | Alpamayo family |
| NVIDIA Isaac GR00T | 로보틱스 | Isaac GR00T |
| NVIDIA Clara | 바이오메디컬 및 헬스케어 | Clara |
이 모델들은 기업이 실제 AI 시스템을 구축하는 데 필요한 빌딩 블록을 제공합니다.
오픈‑소스 리소스 및 데이터
- 학습 프레임워크 – 완전 오픈‑소스이며 맞춤형으로 바로 사용할 수 있습니다.
- 멀티모달 데이터 컬렉션 – 세계 최대 규모 중 하나로, 포함 내용:
- 10 조 언어 학습 토큰
- 500,000 로봇 궤적
- 455,000 단백질 구조
- 100 TB 차량 센서 데이터
이처럼 전례 없는 규모의 다양하고 오픈된 리소스는 언어 모델, 로보틱스, 과학 연구 및 자율주행 차량 분야의 혁신을 가속화합니다.
초기 채택자
다음과 같은 선도 기술 기업들이 이미 NVIDIA의 오픈‑모델 생태계를 기반으로 구축하고 있습니다:
- Bosch
- CodeRabbit
- CrowdStrike
- Cohesity
- Fortinet
- Franka Robotics
- Humanoid
- Palantir
- Salesforce
- ServiceNow
- Hitachi
- Uber
자세한 내용은 위에 있는 링크된 리소스를 확인하세요.
NVIDIA Nemotron이 음성, 멀티모달 인텔리전스 및 안전성을 AI 에이전트에 제공
최근에 출시된 NVIDIA Nemotron 3 오픈 모델 및 데이터 제품군을 기반으로, NVIDIA는 음성, 멀티모달 검색‑증강 생성 (RAG), 그리고 안전성을 위한 Nemotron 모델을 공개합니다.
Nemotron Speech
- Model:
nemotron-speech-realtime-en-600m– 실시간 영어 음성에 대해 리더보드 1위를 차지한 오픈 모델. - ASR variant:
nemotron-speech-streaming-en-0.6b– 실시간 캡션 및 음성‑AI 애플리케이션을 위한 저지연 스트리밍 음성‑텍스트 변환. - Performance: Daily 및 Modal 벤치마크에서 동일 클래스의 경쟁 모델보다 ≈10배 빠른 추론 속도를 보여줍니다. 전체 벤치마크 세부 내용은 여기에서 확인하세요.
Nemotron RAG
- Collection: Nemotron RAG – 검색‑증강 생성을 위한 비전‑언어 모델 모음.
- Embed model:
llama-nemotron-embed-vl-1b-v2– 다국어·멀티모달 임베딩. - Rerank model:
llama-nemotron-rerank-vl-1b-v2– 문서 검색 및 정보 검색을 위한 고정밀 재정렬 모델.
Nemotron Safety
- Content‑safety model:
Llama-3.1-Nemotron-Safety-Guard-8B-v3– 안전한 AI 상호작용을 위한 언어 지원 확대. - PII detection:
gliner-PII– 개인 식별 정보를 높은 정밀도로 탐지하는 GLiNER 기반 모델.
초기 도입자
| 회사 | 사용 사례 | 비고 |
|---|---|---|
| Bosch | Nemotron Speech | 운전자가 음성으로 차량과 상호작용할 수 있게 함. |
| ServiceNow | Apriel 모델 훈련 | Nemotron을 포함한 공개 데이터셋을 활용해 비용 효율적인 멀티모달 성능을 제공. |
| Cadence, IBM | Nemotron RAG | 복잡한 기술 문서 전반에 걸친 향상된 검색 및 추론을 파일럿 테스트 중. |
| CrowdStrike, Cohesity, Fortinet | Nemotron Safety | AI 애플리케이션의 신뢰성을 강화. |
| Palantir | 온톨로지 프레임워크 | 통합 AI‑에이전트 스택을 위해 Nemotron 모델을 통합. |
| CodeRabbit | AI 코드 리뷰 | 확장 가능하고 정확한 코드‑리뷰 파이프라인을 지원 (demo). |
개발자를 위한 리소스
데이터셋 및 훈련 코드
- Embed Nemotron v1 dataset – https://huggingface.co/datasets/nvidia/embed-nemotron-dataset-v1
- Training code (Biencoder example) – https://github.com/NVIDIA-NeMo/Automodel/tree/main/examples/biencoder
- Llama Embed Nemotron 8B 모델에 사용됨: https://huggingface.co/nvidia/llama-embed-nemotron-8b (MMTEB 리더보드 엔트리).
- Granary dataset – https://huggingface.co/datasets/nvidia/Granary
- 새로운 Nemotron Speech ASR 모델을 구축하는 데 활용됨.
도구
- LLM Router – 개발자에게 AI 요청을 가장 적합한 모델로 자동 라우팅하는 방법을 보여주는 최신 버전. https://build.nvidia.com/nvidia/llm-router
이러한 오픈소스 자산과 Nemotron 모델군을 결합하면 음성 지원, 멀티모달, 안전한 AI 에이전트를 구축하기 위한 전체 스택을 제공합니다.
Source: …
모든 유형의 물리적 AI 및 로봇을 위한 새로운 모델
물리적 AI를 로봇 및 자율 시스템에 적용하려면 복잡하고 실제 세계 환경에서 인지, 추론, 행동할 수 있는 방대한 다양성의 데이터셋과 모델이 필요합니다. Hugging Face에서 로봇 분야는 가장 빠르게 성장하는 세그먼트이며, NVIDIA의 오픈소스 로봇 모델 및 데이터셋이 플랫폼 다운로드를 선도하고 있습니다 — AI World 스토리를 확인하세요.
NVIDIA Cosmos Foundation Models
NVIDIA는 **NVIDIA Cosmos 오픈월드 파운데이션 모델**을 출시하여 인간과 같은 추론 및 세계 생성 능력을 제공하고 물리‑AI 개발 및 검증을 가속화합니다.
| 모델 | 설명 | 주요 링크 |
|---|---|---|
| Cosmos Reason 2 | 로봇 및 AI 에이전트를 위한 리더보드 1위 추론 VLM | • GitHub • Leaderboard |
| Cosmos Transfer 2.5 | 다양한 환경에서 대규모 합성 비디오를 생성 | • GitHub |
| Cosmos Predict 2.5 | 견고한 시뮬레이션 및 계획을 위해 미래 프레임과 동역학을 예측 | • GitHub • Benchmark leaderboard |
Cosmos 기반 오픈 모델 및 청사진
- Isaac GR00T N1.6 – 인간형 로봇을 위해 설계된 오픈 추론 비전‑언어‑액션(VLA) 모델. 전신 제어를 가능하게 하고 Cosmos Reason를 활용해 풍부한 맥락 이해를 제공합니다. → GitHub repo
- NVIDIA Blueprint for Video Search & Summarization – NVIDIA Metropolis 플랫폼의 일부로, 이 레퍼런스 워크플로우는 비전‑AI 에이전트가 방대한 양의 녹화 및 실시간 영상을 분석하도록 하여 운영 효율성과 공공 안전을 향상시킵니다. → Blueprint page
Cosmos Reason를 활용하는 기업
- Salesforce, Milestone, Hitachi, Uber, VAST Data, Encord – 교통 관리 및 업무 생산성 AI 에이전트에 Cosmos Reason를 사용.
- Franka Robotics, Humanoid, NEURA Robotics – Isaac GR00T을 배포해 새로운 로봇 행동을 시뮬레이션, 훈련 및 검증한 뒤 생산 단계로 확장.
“Cosmos Reason는 물리적 세계를 전례 없는 정밀도로 이해하고 행동할 수 있는 새로운 세대의 AI 에이전트를 가능하게 하고 있습니다.” – NVIDIA AI Research
모든 링크는 2026년 1월 현재 최신 상태입니다.
추론 기반 자율주행 차량을 위한 NVIDIA Alpamayo
안전하고 확장 가능한 자율주행을 개발하려면 인식하고, 추론하며, 행동할 수 있는 AI가 복잡한 실제 환경에서 필요합니다. NVIDIA는 NVIDIA Alpamayo라는 새로운 오픈 모델군, 시뮬레이션 도구, 대규모 데이터셋을 공개하여 추론 기반 자율주행 차량 개발을 촉진합니다.
- Alpamayo 1 – 자율주행 차량을 위한 최초의 오픈 대규모 추론 VLA 모델입니다. 차량이 주변을 이해하고 자신의 행동을 설명할 수 있게 합니다.
- AlpaSim – 다양한 환경과 엣지 케이스에서 추론 기반 AV 모델을 폐루프 방식으로 학습하고 평가할 수 있는 오픈소스 시뮬레이션 프레임워크입니다.
- Physical AI Open Datasets – https://huggingface.co/datasets/nvidia/PhysicalAI-Autonomous-Vehicles 에서 제공되는 > 1,700 시간의 주행 데이터로, 다양한 지리적 위치와 조건을 포함하며, 추론 아키텍처에 필수적인 희귀 엣지 케이스를 담고 있습니다.
NVIDIA Clara for 헬스케어 및 생명과학
비용을 절감하고 치료를 더 빠르게 제공하기 위해, NVIDIA는 디지털 발견과 실제 의료 사이의 격차를 메우는 새로운 Clara AI 모델들을 출시합니다.
- La‑Proteina – 연구 및 약물 후보 개발을 위해 크고 원자 수준에서 정밀한 단백질을 설계합니다.
- ReaSyn v2 – AI가 설계한 약물에 제조 청사진을 통합하여 실용적인 합성을 보장합니다.
- KERMT – 약물‑인간 상호작용을 예측함으로써 개발 초기 단계에서 고정밀 계산 안전성 테스트를 제공합니다.
- RNAPro – RNA 분자의 복잡한 3D 형태를 예측하여 개인 맞춤형 의학의 잠재력을 열어줍니다.
NVIDIA는 또한 AI 연구자들이 보다 정확한 모델을 구축할 수 있도록 455 000개의 합성 단백질 구조 데이터셋을 공개했습니다. 논문은 arXiv에서 확인하세요.
NVIDIA 오픈 모델 및 기술 시작하기
- GitHub
- Hugging Face
- 다양한 클라우드, 추론 및 AI‑인프라 플랫폼
- build.nvidia.com
많은 모델이 NVIDIA NIM microservices 로도 제공되어, 엣지부터 클라우드까지 모든 NVIDIA‑가속 인프라에서 안전하고 확장 가능한 배포가 가능합니다.
더 알아보려면 시청하세요 NVIDIA Live at CES.