Stability AI, 6분짜리 노래를 만들 수 있는 새로운 오디오 모델을 출시

발행: 3주 전 (2026년 5월 21일 AM 12:00 GMT+9)

4 분 소요

Source: TechCrunch

새로운 Stability Audio 3.0 모델

Stability AI는 Stable Diffusion을 만든 회사로, Stability Audio 3.0이라는 새로운 오디오 모델군을 출시합니다. 최고 모델은 6분 이상 길이의 전문가 수준 음악을 생성할 수 있습니다.

Stability Audio 3.0 이름 아래 네 가지 모델이 있습니다:

Medium 및 Large 모델은 전체 6 분 20 초 길이 동안 음악 구조와 멜로디 톤을 유지할 수 있으며, 이는 Stable Audio 2.0(2024년 출시)에서 지원하던 지속 시간의 두 배 이상입니다.

Small SFX, Small, 그리고 Medium 모델: 누구나 사용하고 수정할 수 있도록 오픈 가중치 제공.
Large 모델: API와 유료 자체 호스팅 서비스에서만 이용 가능; 매출이 $1 M을 초과하는 기업은 엔터프라이즈 라이선스를 받아야 함.

2024년에 Stability AI는 Stable Audio Open을 출시했으며, 이 버전은 최대 47초 길이의 음악 생성이 가능했습니다. 새로운 모델군은 이전 오픈 버전보다 크게 향상된 기능을 제공합니다.

회사 측은 최신 오디오 모델이 완전하게 라이선스된 데이터를 기반으로 구축되었다고 밝혔습니다.

다수의 기업이 음악 생성 기술을 발전시키고 있습니다:

데이터 라이선스와 관련된 법적 분쟁(예: Suno와 Udio 사이)으로 인해 적절한 라이선스와 레이블 파트너십이 이러한 서비스의 장기적인 생존에 얼마나 중요한지 강조되고 있습니다.

지난해 Stability AI는 다음과 같은 계약을 체결했습니다:

회사는 전문 뮤지션을 위한 새로운 제품군을 개발 중이며, 전 Universal Audio와 Fender의 최고 디지털 책임자였던 Ethan Kaplan이 전문 음악 부문을 이끌기 위해 Stability AI에 합류합니다.

다른 AI 기업들도 업계 임원을 영입해 음악 분야 역량을 강화하고 있습니다:

Stability Audio 3.0 Model Comparison Chart

이미지 출처: Stability AI