핸드-4DGS: 에고센트릭 영상에서 4D 손 재구성을 위한 피드포워드 3D 가우시안 스플래팅
개요
전체적인 3D 손 재구성은 AR/VR 및 AI 글래스와 같은 차세대 컴퓨팅 플랫폼에 필수적입니다. 그럼에도 불구하고, 대부분의 이전 연구는 다중 뷰 3D 손 재구성 또는 4D 인간 몸 전체 재구성에 집중하고 있습니다. 전자식 4D 손 재구성은 빠른 머리 움직임, 급격한 손 동작, 심각한 폐쇄, 단일 뷰 관찰에서 발생하는 본질적 모호성으로 인해 여전히 도전적입니다. 이러한 과제를 해결하기 위해, Hand-4DGS라는 세계 최초의 피드포워드 프레임워크를 도입하여, 전자식 영상에서 직접 동적 4D 손을 재구성하고 빠른(~60 FPS) 추론과 강력한 일반화 능력을 제공합니다. 우리의 접근 방식은 구조적 선행 지식용 메시 기반 표현과 동적 움직임을 모델링하는 시계적 합卷을 포함하고 있습니다. H2O와 ARCTIC이라는 두 어려운 전자식 데이터셋에서 프레임워크를 평가하고, 베이스라인 대비 상당한 향상점을 보여줍니다. 본 방법은 피드포워드 네트워크의 일반화 능력과 가우시안 스플래팅을 통한 효과적인 2D 이미지 감독을 활용하여 비싼 3D 손 자세 지표-ground-truth 주석을 필요로 하지 않습니다.
주요 공헌
이 논문은 다음 분야의 연구를 제시합니다:
- cs.CV
방법론
자세한 방법은 전체 논문을 참고하십시오.
실용적 의미
이 연구는 cs.CV의 발전에 기여합니다.
저자
- Jeongmin Bae
- Seoha Kim
- Marc Pollefeys
- Mahdi Rad
- Youngjung Uh
- Taein Kwon
논문 정보
- arXiv ID: 2606.19156v1
- 분야: cs.CV
- 발행일: 2026년 6월 17일
- PDF: PDF 다운로드