Stability AI, 6분짜리 노래를 만들 수 있는 새로운 오디오 모델을 출시

발행: (2026년 5월 21일 AM 12:00 GMT+9)
4 분 소요
원문: TechCrunch

Source: TechCrunch

새로운 Stability Audio 3.0 모델

Stability AI는 Stable Diffusion을 만든 회사로, Stability Audio 3.0이라는 새로운 오디오 모델군을 출시합니다. 최고 모델은 6분 이상 길이의 전문가 수준 음악을 생성할 수 있습니다.

Stability Audio 3.0 이름 아래 네 가지 모델이 있습니다:

모델파라미터일반적인 사용 사례
Small SFX459 M디바이스 내 사운드 생성, 최대 2 분
Small459 M디바이스 내 음악 생성, 최대 2 분
Medium1.4 B전체 작곡, 최대 6 분 20 초
Large2.7 B전체 작곡, 최대 6 분 20 초 (API / 유료 자체 호스팅)

Medium 및 Large 모델은 전체 6 분 20 초 길이 동안 음악 구조와 멜로디 톤을 유지할 수 있으며, 이는 Stable Audio 2.0(2024년 출시)에서 지원하던 지속 시간의 두 배 이상입니다.

  • Small SFX, Small, 그리고 Medium 모델: 누구나 사용하고 수정할 수 있도록 오픈 가중치 제공.
  • Large 모델: API와 유료 자체 호스팅 서비스에서만 이용 가능; 매출이 $1 M을 초과하는 기업은 엔터프라이즈 라이선스를 받아야 함.

가용성 및 라이선스

2024년에 Stability AI는 Stable Audio Open을 출시했으며, 이 버전은 최대 47초 길이의 음악 생성이 가능했습니다. 새로운 모델군은 이전 오픈 버전보다 크게 향상된 기능을 제공합니다.

회사 측은 최신 오디오 모델이 완전하게 라이선스된 데이터를 기반으로 구축되었다고 밝혔습니다.

산업 배경

다수의 기업이 음악 생성 기술을 발전시키고 있습니다:

데이터 라이선스와 관련된 법적 분쟁(예: SunoUdio 사이)으로 인해 적절한 라이선스와 레이블 파트너십이 이러한 서비스의 장기적인 생존에 얼마나 중요한지 강조되고 있습니다.

파트너십 및 인재

지난해 Stability AI는 다음과 같은 계약을 체결했습니다:

  • Warner Music Group발표
  • Universal Music Group발표

회사는 전문 뮤지션을 위한 새로운 제품군을 개발 중이며, 전 Universal Audio와 Fender의 최고 디지털 책임자였던 Ethan Kaplan이 전문 음악 부문을 이끌기 위해 Stability AI에 합류합니다.

다른 AI 기업들도 업계 임원을 영입해 음악 분야 역량을 강화하고 있습니다:

  • Suno는 전 Merlin CEO Jeremy Sirota를 최고 상업 책임자로 영입 – 출처
  • ElevenLabs는 Kobalt 출신 Derek Cournoyer를 음악 사업 전략 담당 책임자로 임명 – 출처

모델 비교 차트

Stability Audio 3.0 Model Comparison Chart

이미지 출처: Stability AI

0 조회
Back to Blog

관련 글

더 보기 »