[논문] AnimaSpark: 임의 3D 객체 애니메이션을 위한 피드포워드 방식
Source: arXiv - 2606.10988v1
개요
최근 생성형 AI의 발전으로 정적 3D 모델 제작 워크플로우가 크게 가속화되었지만, 카테고리‑무관 3D 애니메이션 합성은 여전히 3D 자산 제작에서 큰 병목 현상으로 남아 있습니다. 현재의 카테고리‑무관 애니메이션 생성 방법은 추론 속도, 움직임 품질, 텍스트 프롬프트와의 정합성 측면에서 심각한 제한을 가지고 있어, 작업이 노동 집약적인 수작업 아트에 의존하게 됩니다. 이러한 문제를 해결하고자 본 논문에서는 카테고리‑무관 3D 애니메이션 생성을 위한 새로운 파이프라인인 AnimaSpark를 제안합니다. 우리의 접근법은 3D 세계의 많은 기본 움직임에 대해 해당 관절 변환을 2차원 부분공간 내에서 효과적으로 모델링할 수 있다는 핵심 통찰에 기반합니다. 파이프라인은 먼저 리깅된 정적 3D 모델을 메쉬와 스켈레톤의 다중 레이어 이미지 표현으로 렌더링하고, 이를 비디오 생성 모델에 입력합니다. 생성된 비디오에 키포인트 트래킹 알고리즘을 적용해 카메라 시점 평면에 투영된 스켈레톤 관절의 움직임을 포착합니다. 마지막 단계에서는 추적된 키포인트로부터 평면 이동 및 회전을 추출하고, 이를 2D 영역에서 3D 공간으로 승화시켜 캐릭터에 애니메이션을 입힙니다. 종합적인 평가 결과, 본 방법은 텍스트‑동작 정합성, 움직임 품질, 계산 효율성 등 주요 지표에서 기존 최첨단 기술들을 능가하는 우수한 성능을 보였습니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다:
- cs.CV
- cs.GR
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 시사점
본 연구는 cs.CV 분야의 발전에 기여합니다.
저자
- Yiming Zhao
- Haoyu Sun
- Aoyu Wang
논문 정보
- arXiv ID: 2606.10988v1
- 분류: cs.CV, cs.GR
- 발표일: 2026년 6월 9일
- PDF: PDF 다운로드