[논문] 사운드 생성의 품질·다양성 탐색: 오디오 탐사를 위한 혁신 엔진 연구

발행: (2026년 6월 9일 AM 02:40 GMT+9)
4 분 소요
원문: arXiv

출처: arXiv - 2606.09780v1

개요

본 연구는 작곡가와 사운드 디자이너가 음악적 목표를 달성하기 위해 도구를 만들고 다듬는 과정에서 직면하는 과제들을 다룹니다. 다양성을 촉진하고 우연한 발견을 유도하는 진화적 과정을 활용하여, 미지의 사운드 공간을 자동으로 탐색함으로써 사운드 발견을 자동화하고, 다양성 증진 알고리즘이 사운드의 이론적 구현과 실용적 접근성 사이의 격차를 메울 수 있다고 주장합니다. 우리는 Innovation Engine 알고리즘에서 영감을 얻어, Quality Diversity (QD) 알고리즘과 지도 학습 판별 모델을 결합한 생성 사운드 합성 시스템을 기술하고, 다양한 구성과 선택된 합성 방식과 판별 모델 간의 상호작용을 탐구합니다. Compositional Pattern Producing Networks (CPPNs)와 디지털 신호 처리(DSP) 그래프 간의 상호작용을 조사하고, 서로 다른 주파수 대역에 대해 여러 개의 특화된 CPPN을 사용하는 새로운 접근법을 제시합니다; 이는 단일 CPPN 설정과 비교해도 성능을 유지하면서 네트워크를 더 단순화합니다. 또한, 음악적 맥락과 비음악적 맥락 사이의 목표 전환을 분석함으로써 진화적 디딤돌을 조사하고, 계통이 현재 엘리트에 도달하기 위해 어떻게 예상치 못한 경로를 탐색하는지 밝혀냅니다. 이전 연구의 행동 공간을 다양한 사운드 길이를 포함하도록 확장함으로써, 시간적 니치 내에서의 전문화를 발견합니다. 결과는 CPPN과 DSP 그래프가 다차원 표현형 엘리트 아카이브(MAP‑Elites) 및 딥러닝 분류기와 결합될 때, 시간적 및 맥락적 차원에서 다양하고 혁신적인 합성 사운드의 상당한 다양성을 생성할 수 있음을 보여줍니다. 우리는 생성된 사운드 객체를 온라인 탐색기와 렌더링된 사운드 파일 형태로 제공하며, 음악 작곡 맥락에서 다양한 길이와 상황에 걸친 창의적 잠재력을 보여주는 실험적 애플리케이션도 제시합니다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다:

  • cs.SD
  • cs.NE

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.SD 분야의 발전에 기여합니다.

저자

  • Björn Þór Jónsson
  • Çağrı Erdem
  • Stefano Fasciani
  • Kyrre Glette

논문 정보

  • arXiv ID: 2606.09780v1
  • Categories: cs.SD, cs.NE
  • Published: 2026년 6월 8일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »