레코드 스크래치—Google의 Lyria 3 AI 음악 모델이 오늘 Gemini에 출시됩니다
Source: Ars Technica
Source:
Rage Against the Machine Learning
“간단한 프롬프트만으로도 30초 정도의 음악 같은 것을 생성할 수 있다.”
Credit: Google
미국 시인 헨리 워즈워스 롱펠로우는 음악을 “인류의 보편적인 언어”라고 불렀다. 인간이 아닌 확률적 로봇에 의해 생성되는 이른바 음악은 아직도 그런가? 이제 확인해 보자.
Google은 최신 Lyria 3 AI 모델이 **Gemini 앱에 배포**되고, AI‑생성 음악에 대한 접근성을 크게 확대한다고 발표했다.
- Lyria 3은 이전에 Vertex AI와 같은 개발자용 제품을 통해서만 사용할 수 있던 버전을 기반으로 한다.
- 더 빠르고, 더 강력하다.
- 사용하려면 Gemini 앱이나 웹 UI에서 “Create music” 옵션을 선택한다.
- 원하는 내용을 설명하고, 원한다면 분위기 안내용 이미지를 업로드하면, 몇 초 만에 30초 트랙을 받아볼 수 있다.
과거 버전과 달리 이제 가사를 제공할 필요가 없다. 대략적인 프롬프트만으로도 모델이 적절한 가사를 생성한다(대부분 짧은 “징글” 형태가 된다).
각 음악 생성 작업에는 Nano Banana 모델이 만든 앨범 커버 스타일 이미지도 함께 제공된다. Gemini에는 미리 로드된 AI 트랙 세트가 있어 이를 리믹스할 수 있고, Lyria 3 도구는 YouTube Shorts용 Google Dream Track 툴킷에도 곧 추가될 예정이며, 이는 Veo AI 비디오 옵션을 보완한다.
샘플 트랙
아래는 몇 가지 예시 프롬프트와 Google이 공유한 결과 스타일입니다.
“플랜틴처럼 달콤하게”
Prompt:
나는 향수를 느끼고 있어요. 어릴 적 함께했던 즐거운 시간과 엄마가 직접 만든 플랜틴에 대한 추억을 담은 트랙을 엄마를 위해 만들어 주세요. 진정한 아프리카 느낌의 신나는 아프로비트 트랙으로 만들어 주세요.
“모타운 패러디”
Prompt:
전형적인 1970년대 모타운 소울. 풍성하고 오케스트라 같은 R&B 프로덕션. 멜로딕 필이 가미된 따뜻한 베이스라인, 깔끔한 스네어와 탬버린이 어우러진 안정된 드럼 그루브. 빈티지 오르간 하모닉 베드. 3인 브라스 섹션. 거친 느낌에 복음적인 색채가 더해진 남성 테너 리드.
“팝 플러터”
Prompt:
그리움과 공기 같은 느낌. 부드럽고 숨결 같은 여성 보컬에 친밀감이 담겨 있습니다. 빠른 드럼과 베이스 리듬, 저역을 필터링하고 부드럽게 처리. 깊고 따뜻한 베이스 스웰. 꿈같은 전자 피아노 코드와 은은한 차임 텍스처. 비 내리는 도시 분위기.
“바다 선창”
Prompt:
전통적인 콜앤리스폰스 형식의 강인한 남성 합창단이 참여한 진정한 아카펠라 바다 선창. 이 곡은 나무 갑판 위에서 동기화된 발구르기와 날카로운 손뼉 치기로만 리듬을 구성합니다. 리드는 거친 음색을 가진 풍화된 남성 바리톤이며, 풍부하고 거친 하모니의 강력한 남성 합창단이 응답합니다. 나무 선박 갑판을 시뮬레이션하기 위해 자연스러운 방 울림으로 녹음되었으며, 공연은 활기차고 공동체적이며 완전히 보컬만으로 이루어집니다—악기 없이 텐어, 바리톤, 베이스를 아우르는 겹겹이 쌓인 남성 목소리만으로 구성됩니다.
Lyria 3를 실험해 보세요, 몇 마디 말만으로 어떤 음악 세계를 만들어 낼 수 있는지 확인해 보세요!
Sour notes
AI‑generated music은 새로운 현상이 아닙니다. 여러 기업이 모델을 제공하여 인간이 만든 음악을 받아들이고 동질화하며, 그 결과물은 다소 과도하게 제작된 느낌이 있긴 해도 놀라울 정도로 “실제와 같은” 사운드를 낼 수 있습니다. 스트리밍 서비스는 이미 가짜 AI 아티스트들로 넘쳐나고 있으며, 그 중 일부는 수천 명의 청취자를 모으고 있습니다. 이 청취자들은 자신들이 블렌더를 퓌레 모드로 설정한 것과 같은 음악을 듣고 있다는 사실조차 모를 수도 있습니다.
이러한 도구들을 직접 찾아야 하지만, 구글은 Gemini 앱에 유사한 기능을 도입하고 있습니다. 가장 인기 있는 AI 플랫폼 중 하나인 만큼, 앞으로 인터넷에서 AI 음악을 훨씬 더 많이 보게 될 것입니다. 구글에 따르면 Lyria 3으로 생성된 트랙에는 구글의 SynthID 오디오 버전이 삽입됩니다. 즉, Gemini에 업로드하면 해당 오디오가 구글 AI로 생성되었는지 언제든지 확인할 수 있습니다—이미 이미지와 비디오에 대한 SynthID 태그를 확인할 수 있는 방식과 유사합니다.
구글은 또한 저작권 및 파트너 계약을 존중하는 음악 AI를 만들기 위해 노력했다고 밝혔습니다. 프롬프트에 특정 아티스트를 언급하면 Gemini는 그 아티스트의 사운드를 복제하려 하지 않고, 해당 이름을 “광범위한 창작 영감”으로 간주합니다. 이 과정이 완벽하지는 않으며, 일부 출력물은 여전히 아티스트를 너무 가깝게 모방할 수 있다고 회사는 언급했습니다. 이러한 경우 구글은 사용자가 신고하도록 권장하고 있습니다.
릴리스 세부 정보
- Lyria 3가 오늘 Gemini 웹 인터페이스에서 출시되며 며칠 내에 모바일 앱에서도 제공될 예정입니다.
- 지원 언어: 영어, 독일어, 스페인어, 프랑스어, 힌디어, 일본어, 한국어, 포르투갈어(추가 예정).
- 모든 사용자는 음악 생성에 일부 접근 권한을 갖게 되며, AI Pro 및 AI Ultra 구독자는 더 높은 사용 한도를 받습니다(정확한 수치는 공개되지 않음).
저자 소개
Ryan Whitwam은 Ars Technica의 수석 기술 기자로, Google, AI, 모바일 기술이 어떻게 세상을 계속 변화시키는지 다룹니다. 20년 경력 동안 그는 Android Police, ExtremeTech, Wirecutter, The New York Times 등에서 글을 썼습니다. 그는 대부분의 사람이 평생 소유할 수 있는 것보다 더 많은 휴대폰을 리뷰했습니다. Bluesky에서 팔로우 하면 그의 수십 개의 기계식 키보드 사진을 볼 수 있습니다.
123 댓글

