[논문] PianoKontext: 무표정한 맥락에서 표현적 연주 렌더링

발행: (2026년 6월 11일 AM 01:20 GMT+9)
2 분 소요
원문: arXiv

Source: arXiv - 2606.12282v1

개요

표현적 연주 렌더링(EPR)은 음표 시퀀스에 제약된 현실적인 연주를 생성하는 것을 목표로 합니다. 그러나 흐름 매칭 오디오 편집 모델은 동일한 길이의 동기화된 음악 샘플만을 조작하므로 표현적 타이밍에 대한 이해가 제한됩니다. 우리는 클래식 피아노 음악을 위한 흐름 매칭 렌더링 모델인 PianoKontext를 소개합니다. 이 모델은 사전 학습된 Music2Latent 모델의 잠재 공간에서 가변 길이의 연주를 생성합니다. 우리는 MIDI 악보를 무표정(deadpan) 오디오로 합성하고, 잠재 공간에서 동적 시간 왜곡(DTW)을 활용해 학습용 짝 데이터를 구성합니다. 정렬된 임베딩은 DiT 블록에 연결되어 악보와 연주 간 의존성을 간단하고 효과적으로 학습할 수 있습니다. 오디오 샘플은 데모 페이지에서 확인할 수 있습니다: https://realfolkcode.github.io/pianokontext_demo/.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다:

  • cs.SD
  • cs.LG

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.SD 분야의 발전에 기여합니다.

저자

  • Dmitrii Gavrilev

논문 정보

  • arXiv ID: 2606.12282v1
  • Categories: cs.SD, cs.LG
  • Published: June 10, 2026
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »