[논문] 푸리에 특성으로 에이전트가 모방 학습을 통해 고정밀 정책을 학습】
개요
고정밀 로봇 조작은 미세한 공간 추론을 필요로 하는데, 이는 깊이 모호성 및 원근 스케일 문제 때문에 RGB‑만을 이용한 정책으로는 달성하기 어려운 경우가 많다. 포인트 클라우드와 같이 3D 정보를 직접 활용하는 정책은 순수 이미지 기반 정책에 비해 더 강력한 기하학적 사전 지식을 제공하지만, 그 성능은 여전히 작업에 크게 의존한다. 우리는 이러한 차이가 신경망이 저주파 함수를 학습하는 스펙트럴 바이어스 때문이며, 특히 느리게 변하는 데카르트 좌표 특징에 조건화된 아키텍처에 큰 영향을 미친다고 가정한다. 따라서 우리는 포인트 클라우드를 데카르트 공간에서 고차원 푸리에 공간으로 매핑하여, 포인트 클라우드 인코더가 고주파 특징에 직접 접근할 수 있도록 하는 방법을 제안한다. 우리는 RoboCasa와 ManiSkill3 벤치마크의 어려운 조작 작업 및 실제 로봇 설정에서 푸리에 특징 사용을 실험적으로 검증한다. 그 단순함에도 불구하고, 푸리에 특징이 다양한 인코더 아키텍처와 벤치마크 전반에 걸쳐 상당한 이점을 제공하고 하이퍼파라미터에 대해 강인함을 보임을 발견했다. 우리의 결과는 푸리에 특징이 정책이 기하학적 세부 정보를 데카르트 특징보다 더 효과적으로 활용하게 함을 보여주며, 포인트 클라우드 기반 모방 학습을 위한 범용 도구로서의 잠재력을 시사한다. 프로젝트 페이지에서 소스 코드와 동영상을 제공한다: https://fourier-il.github.io/fourier-il
주요 기여
이 논문은 다음 분야의 연구를 제시한다:
- cs.LG
- cs.RO
방법론
자세한 방법론은 전체 논문을 참고하시기 바란다.
실용적 함의
이 연구는 cs.LG 분야의 발전에 기여한다.
저자
- Balázs Gyenes
- Emiliyan Gospodinov
- Jan Frieling
- Enrico Krohmer
- Nicolas Schreiber
- Xiaogang Jia
- Niklas Freymuth
- Gerhard Neumann
논문 정보
- arXiv ID: 2606.12334v1
- 분류: cs.LG, cs.RO
- 발표일: 2026년 6월 10일
- PDF: PDF 다운로드