Gemini Omni, 구글의 새로운 월드 모델, 고급 AI 영상 생성 기능 탑재
Source: Mashable Tech
개요
Google은 Google I/O 2026에서 Gemini Omni라는 새로운 AI 월드 모델을 공개했습니다. 회사는 Gemini Omni를 “어떤 출력이든 만들 수 있는 새로운 모델”이라고 설명했으며, 시연에서는 고급 비디오 생성 능력이 강조되었습니다. Omni 패밀리의 첫 번째 출시 버전은 Gemini Omni Flash입니다.

출처: Google
Gemini Omni Flash와 다른 AI 비디오 도구 비교
Gemini Omni Flash는 Google Veo와 이전 Genie 월드 모델(Google’s Genie world model) 등 기존 도구와 차별화됩니다. I/O 발표 중 DeepMind CEO Demis Hassabis는 Omni를 AGI를 향한 중요한 단계라고 강조했으며, 향후 버전에서는 사용자가 요청하는 “모든 것”을 출력할 수 있을 것이라고 밝혔습니다.
다중 모달 입력 및 출력
많은 텍스트‑투‑비디오 시스템과 달리 Gemini Omni는 입력과 출력 모두 다중 모달을 지원합니다:
- 입력: 텍스트, 오디오, 이미지, 비디오
- 출력: 생성된 비디오, 인터랙티브 월드, 기타 미디어
이 모델은 Gemini의 방대한 현실 세계 지식을 활용해 독특하고 상황에 맞는 콘텐츠를 만들어냅니다.
비디오 생성 품질
Google은 Omni가 다음과 같은 비디오를 만들 수 있다고 주장합니다:
- 물리 법칙을 더 정확히 반영해 현실감 있는 장면 구현
- 맥락 이해(예: 역사적 사실)로 사실 정확도 향상

출처: Google
대화형 비디오 편집
Omni는 대화를 통한 편집도 지원합니다. 사용자는 다음을 할 수 있습니다:
- 기존 클립이나 AI가 만든 클립의 배경, 스타일, 각도, 풍경, 특정 디테일 등을 수정
- 원하는 변화를 설명하면서 비디오를 인터랙티브하게 다듬기

출처: Google
아바타 및 SynthID 워터마크
- 아바타: Gemini Omni Flash는 사용자의 모습을 디지털 아바타로 만들 수 있지만, 책임감 있는 출시를 위해 아직 테스트 단계에 있습니다.
- SynthID 워터마크: 모든 생성 비디오에는 SynthID 워터마크가 삽입되어, 해당 콘텐츠가 AI에 의해 제작되었음을 검증할 수 있습니다.
제공 일정
- 오늘: Gemini Omni Flash는 Gemini 앱과 Google Flow를 통해 유료 Google AI Plus, Pro, Ultra 구독자에게 순차적으로 제공됩니다.
- 이번 주 말: 이 기능이 YouTube Shorts와 YouTube Create 앱에 무료로 출시될 예정입니다.