[논문] RoboNaldo: 움직임 기반 커리큘럼 강화학습으로 구현한 정확하고 안정적이며 강력한 휴머노이드 축구 슈팅

발행: 3일 전 (2026년 6월 10일 AM 01:51 GMT+9)

4 분 소요

원문: arXiv

Source: arXiv - 2606.11092v1

개요

엘리트 인간형 로봇의 축구 슈팅은 전신의 안정성, 고임펄스 전신 상호작용, 그리고 목표물에 대한 정확성을 요구한다. 모션 트래킹 기반 강화학습(RL)은 전신 움직임 조정에서 안정성을 제공하지만, 고정된 레퍼런스 때문에 다양한 공 위치와 타격 타이밍에 적응하기 어렵다. 반면, 과제 보상 기반 RL은 처음부터 유효한 킥을 탐색하고 발견하는 데 어려움을 겪는다. 따라서 우리는 고임펄스 인간형 상호작용을 위한 3단계 모션 가이드 커리큘럼 RL 프레임워크인 RoboNaldo를 제안한다. 하나의 인간 킥 레퍼런스를 스캐폴드로 사용하고, 점진적으로 최적화를 슈팅 성능으로 전환한다. 커리큘럼은 먼저 안정적인 전신 킥 사전학습을 수행하고, 그 다음 공이 정지한 임의 위치에 놓인 프리킥 상황에 킥을 적응시키며, 마지막으로 이동하는 공을 향한 슈팅을 위해 보행 명령과 킥 트리거 인터페이스를 확장한다. 훈련 중에는 고수준 휴리스틱 플래너가 이 인터페이스를 제어하고, 추론 단계에서는 다른 고수준 컨트롤러가 동일한 저수준 정책을 구동할 수 있다. 시뮬레이션에서 RoboNaldo는 기존 작업 베이스라인 대비 프리킥 샷 오류를 48.6% 감소시키고, 슈팅 속도를 2.96배 향상시켰다. 실제 Unitree G1 로봇에 온보드 인식을 적용한 실험에서는 3 m 거리에서 프리킥과 이동 공 상황 각각 평균 목표 슈팅 오류가 0.73 m와 0.86 m에 달했다. 또한 접촉 후 공 속도는 13.10 m/s에 이르며, 이는 보고된 프로페셔널 오픈플레이 샷 속도의 59‑71%에 해당한다. 프로젝트 페이지: $\href{https://opendrivelab.com/RoboNaldo}{\text{opendrivelab.com/RoboNaldo}}$.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

cs.RO
cs.AI

방법론

자세한 방법론은 전체 논문을 참고하시기 바란다.

실용적 함의

본 연구는 cs.RO 분야의 발전에 기여한다.

저자

Yichao Zhong
Yidan Lu
Yuhang Lu
Tianyang Tang
Haoguang Mai
Yixuan Pan
Tianyu Li
Li Chen
Jingbo Wang
Zhongyu Li
Peng Lu
Hongyang Li

논문 정보

arXiv ID: 2606.11092v1
분류: cs.RO, cs.AI
발표일: 2026년 6월 9일
PDF: PDF 다운로드

[논문] RoboNaldo: 움직임 기반 커리큘럼 강화학습으로 구현한 정확하고 안정적이며 강력한 휴머노이드 축구 슈팅

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] UniIntervene: 효율적인 실세계 강화학습을 위한 에이전트 기반 개입

[논문] Ambient Diffusion Policy: 로봇 분야 비최적 데이터로부터 모방 학습

[논문] 서브쿼드러틱 아키텍처: 응용에서 원리까지

[논문] 결손 모달리티가 있는 다중모달 학습을 위한 잠재 세계 복원