[논문] RoboNaldo: 움직임 기반 커리큘럼 강화학습으로 구현한 정확하고 안정적이며 강력한 휴머노이드 축구 슈팅

발행: (2026년 6월 10일 AM 01:51 GMT+9)
4 분 소요
원문: arXiv

Source: arXiv - 2606.11092v1

개요

엘리트 인간형 로봇의 축구 슈팅은 전신의 안정성, 고임펄스 전신 상호작용, 그리고 목표물에 대한 정확성을 요구한다. 모션 트래킹 기반 강화학습(RL)은 전신 움직임 조정에서 안정성을 제공하지만, 고정된 레퍼런스 때문에 다양한 공 위치와 타격 타이밍에 적응하기 어렵다. 반면, 과제 보상 기반 RL은 처음부터 유효한 킥을 탐색하고 발견하는 데 어려움을 겪는다. 따라서 우리는 고임펄스 인간형 상호작용을 위한 3단계 모션 가이드 커리큘럼 RL 프레임워크인 RoboNaldo를 제안한다. 하나의 인간 킥 레퍼런스를 스캐폴드로 사용하고, 점진적으로 최적화를 슈팅 성능으로 전환한다. 커리큘럼은 먼저 안정적인 전신 킥 사전학습을 수행하고, 그 다음 공이 정지한 임의 위치에 놓인 프리킥 상황에 킥을 적응시키며, 마지막으로 이동하는 공을 향한 슈팅을 위해 보행 명령과 킥 트리거 인터페이스를 확장한다. 훈련 중에는 고수준 휴리스틱 플래너가 이 인터페이스를 제어하고, 추론 단계에서는 다른 고수준 컨트롤러가 동일한 저수준 정책을 구동할 수 있다. 시뮬레이션에서 RoboNaldo는 기존 작업 베이스라인 대비 프리킥 샷 오류를 48.6% 감소시키고, 슈팅 속도를 2.96배 향상시켰다. 실제 Unitree G1 로봇에 온보드 인식을 적용한 실험에서는 3 m 거리에서 프리킥과 이동 공 상황 각각 평균 목표 슈팅 오류가 0.73 m와 0.86 m에 달했다. 또한 접촉 후 공 속도는 13.10 m/s에 이르며, 이는 보고된 프로페셔널 오픈플레이 샷 속도의 59‑71%에 해당한다. 프로젝트 페이지: $\href{https://opendrivelab.com/RoboNaldo}{\text{opendrivelab.com/RoboNaldo}}$.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

  • cs.RO
  • cs.AI

방법론

자세한 방법론은 전체 논문을 참고하시기 바란다.

실용적 함의

본 연구는 cs.RO 분야의 발전에 기여한다.

저자

  • Yichao Zhong
  • Yidan Lu
  • Yuhang Lu
  • Tianyang Tang
  • Haoguang Mai
  • Yixuan Pan
  • Tianyu Li
  • Li Chen
  • Jingbo Wang
  • Zhongyu Li
  • Peng Lu
  • Hongyang Li

논문 정보

  • arXiv ID: 2606.11092v1
  • 분류: cs.RO, cs.AI
  • 발표일: 2026년 6월 9일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »