Gemini Omni, 구글의 새로운 월드 모델, 고급 AI 영상 생성 기능 탑재

발행: (2026년 5월 20일 AM 02:45 GMT+9)
4 분 소요

Source: Mashable Tech

개요

Google은 Google I/O 2026에서 Gemini Omni라는 새로운 AI 월드 모델을 공개했습니다. 회사는 Gemini Omni를 “어떤 출력이든 만들 수 있는 새로운 모델”이라고 설명했으며, 시연에서는 고급 비디오 생성 능력이 강조되었습니다. Omni 패밀리의 첫 번째 출시 버전은 Gemini Omni Flash입니다.

Gemini Omni
출처: Google

Gemini Omni Flash와 다른 AI 비디오 도구 비교

Gemini Omni Flash는 Google Veo와 이전 Genie 월드 모델(Google’s Genie world model) 등 기존 도구와 차별화됩니다. I/O 발표 중 DeepMind CEO Demis Hassabis는 Omni를 AGI를 향한 중요한 단계라고 강조했으며, 향후 버전에서는 사용자가 요청하는 “모든 것”을 출력할 수 있을 것이라고 밝혔습니다.

다중 모달 입력 및 출력

많은 텍스트‑투‑비디오 시스템과 달리 Gemini Omni는 입력과 출력 모두 다중 모달을 지원합니다:

  • 입력: 텍스트, 오디오, 이미지, 비디오
  • 출력: 생성된 비디오, 인터랙티브 월드, 기타 미디어

이 모델은 Gemini의 방대한 현실 세계 지식을 활용해 독특하고 상황에 맞는 콘텐츠를 만들어냅니다.

비디오 생성 품질

Google은 Omni가 다음과 같은 비디오를 만들 수 있다고 주장합니다:

  • 물리 법칙을 더 정확히 반영해 현실감 있는 장면 구현
  • 맥락 이해(예: 역사적 사실)로 사실 정확도 향상

Google I/O 발표에서 보여진 Gemini Omni 월드 모델 스크린샷
출처: Google

대화형 비디오 편집

Omni는 대화를 통한 편집도 지원합니다. 사용자는 다음을 할 수 있습니다:

  • 기존 클립이나 AI가 만든 클립의 배경, 스타일, 각도, 풍경, 특정 디테일 등을 수정
  • 원하는 변화를 설명하면서 비디오를 인터랙티브하게 다듬기

Gemini Omni 편집 예시
출처: Google

아바타 및 SynthID 워터마크

  • 아바타: Gemini Omni Flash는 사용자의 모습을 디지털 아바타로 만들 수 있지만, 책임감 있는 출시를 위해 아직 테스트 단계에 있습니다.
  • SynthID 워터마크: 모든 생성 비디오에는 SynthID 워터마크가 삽입되어, 해당 콘텐츠가 AI에 의해 제작되었음을 검증할 수 있습니다.

제공 일정

  • 오늘: Gemini Omni Flash는 Gemini 앱과 Google Flow를 통해 유료 Google AI Plus, Pro, Ultra 구독자에게 순차적으로 제공됩니다.
  • 이번 주 말: 이 기능이 YouTube Shorts와 YouTube Create 앱에 무료로 출시될 예정입니다.
0 조회
Back to Blog

관련 글

더 보기 »