귀에 직접 들리는 음악, 문자 그대로: Gemini가 이제 곡을 쓰고 프로듀싱합니다
Source: Android Authority

Gemini가 음악 작곡가이자 작사가로 상상된 모습. Gemini로 만든 이미지.
TL;DR
- Gemini는 이제 텍스트 또는 이미지 프롬프트만으로 가사까지 포함한 전체 곡을 만들 수 있습니다.
- 또한 Nano Banana를 사용해 트랙에 맞는 앨범 아트를 자동으로 생성합니다.
- 이 기능은 무료 사용자와 유료 사용자 모두에게 널리 제공됩니다.
최근 몇 년 동안 Gemini는 실력을 크게 끌어올렸습니다. 최근 Gemini 3 업데이트는 사진 및 비디오 품질을 비현실적으로 높은 수준으로 끌어올렸고, 더 최근의 deep thinking 업그레이드는 코딩 및 연구 능력을 한층 강화했습니다. 텍스트, 이미지, 비디오, 코드 생성에서 뛰어난 성과를 보인 뒤, 이제 Gemini는 오디오—특히 음악—에 주목하고 있습니다.
오늘 업데이트와 함께 Gemini는 AI 기반 음악 생성에서 큰 도약을 이루어, 간단한 텍스트 또는 이미지 프롬프트만으로 음악을 만들 수 있게 되었습니다. 이 기능은 Google DeepMind의 새롭고 업데이트된 Lyria 3 텍스트‑투‑오디오 모델을 기반으로 합니다. 이전 Lyria 버전은 MusicFX나 PromptDJ와 같은 실험 도구에만 제한됐지만, Google은 Gemini 모바일 앱과 웹 인터페이스를 통해 훨씬 더 넓은 사용자에게 제공하고 있습니다. 이는 지난 달 우리가 언급한 바와 같습니다(Android Authority 기사).
Google에 따르면 사용자는 개념을 설명하거나 이미지를 업로드하면 Gemini가 이를 “고품질, 중독성 있는 트랙”으로 변환합니다. 새로운 기능은 가사도 생성하고, 세련되게 레이어링된 악기들의 복합적이고 멜로디가 풍부한 믹스를 포함한 음악을 만들어냅니다. 지금까지는 Suno와 같은 앱이 AI 생성 음악을 주도했지만, Gemini는 이제 비교 가능한 완전 통합 솔루션을 제공합니다.
이전 Lyria 모델은 제한된 샘플만을 제공했으며, 이를 전체 곡으로 레이어링하고 편곡하려면 인간 전문가가 필요했습니다. 또한 YouTube Shorts용 짧은 악기 클립이나 Pixel 9 및 10 시리즈 폰의 Recorder 앱에서 사용할 수 있는 배경음악 정도에 머물렀습니다.
이번 업데이트로 Gemini는 30초 트랙을 생성하고, Gemini Nano로 만든 앨범 아트까지 제공할 수 있게 되었습니다. 사용자는 추가 지시를 통해 템포, 음악 스타일, 보컬 스타일 등을 세부 조정할 수 있으며, 기존 음악을 제공해 영감으로 활용하도록 할 수도 있습니다.
저작권이 있는 트랙의 무단 사용 방지
Google은 원본 음악을 복제하는 행위에 대해 강경한 입장을 유지하고 있습니다. 각 생성된 트랙에는 AI‑생성 음악과 인간이 만든 작품을 구분할 수 있도록 숨겨진 SynthID가 포함됩니다. Google은 새로운 모델을 학습시킬 때 “저작권 및 파트너 계약을 신중히 고려”했으며, 기존 아티스트를 모방하지 않을 것이라고 주장합니다. 출력된 트랙은 기존 음악 콘텐츠와 비교 테스트를 거쳐 침해 가능성을 차단하고, 사용자는 의심되는 복제 음악을 신고할 수 있습니다.
다른 Gemini 실험과 달리 Google은 음악 제작에 전력을 다하고 있습니다. 이 기능은 영어, 프랑스어, 힌디어, 독일어, 일본어, 한국어, 포르투갈어, 스페인어 등 여러 언어로 베타 버전이 출시됩니다. Gemini 외에도 YouTube Shorts용 Dream Track 오디오 생성기를 통해 이 기능을 이용할 수 있습니다.
이 기능은 무료 사용자와 유료 Gemini 사용자 모두에게 제공되지만, 사용 가능한 크레딧 양은 구독 상태에 따라 달라집니다.