[논문] 물리 AI를 위한 하네스 엔지니어링: 로봇 미들웨어가 하네스 레이어다
개요
Physical AI 시대에 로봇 미들웨어는 새로운 역할을 맡게 된다. 학습된 정책, 플래너, 그리고 비전‑언어‑행동(VLA) 모델이 이제 제어 경로에 인과적인 참여자로 로봇에 배치되지만, 이들을 타이밍, 스케줄링, 네트워크와 통합하는 계층은 아직 명명되지 않았다. 최근 언어‑에이전트 연구에서는 이 계층을 “하네스(harness)”라 부르며, 도구를 중재하고 상태를 관리하며 자원을 제한하고 실행을 기록하는 외부 시스템이라고 정의한다. 로봇 커뮤니티는 아직 이 프레임을 채택하지 않았으며, 우리는 로봇 미들웨어가 바로 그 하네스라고 제안한다. Physical AI 하네스는 소프트웨어 하네스와 달리 개입 시점이 다르다. 소프트웨어 하네스는 도구 호출 경계에서 중재한다. 반면 Physical AI 하네스는 제어, 계산, 통신을 동시에 중재해야 하는데, 이는 학습 정책의 출력이 세 영역을 모두 가로지르기 때문이다: 명령은 궤적을 바꾸고, 추론 시간은 스케줄을 이동시키며, 페이로드는 대역폭을 차지한다. 로봇 미들웨어는 세 영역 모두에 대한 중재 추상화를 제공하는 가장 낮은 로봇 스택 계층이므로, 이들의 강제 실행을 조합하기에 최적의 위치에 있다. 미들웨어는 이미 하네스가 필요로 하는 대부분을 제공하지만, AI 모델에 대한 강제 실행은 부족하다. 우리는 이 부족한 강제 실행을 세 가지 기능으로 명명한다: Projection – 출력이 방출될 때마다 게이트를 두고, Isolation – 모델의 실행 및 전송 슬롯을 제한하며, Transfer – 검증된 베이스라인으로 회귀한다(검사 실패 시). 현재 이러한 기능은 배포된 로봇 시스템에서 손수 만든 애플리케이션 코드 형태로 존재하며, 로봇 미들웨어가 이미 제공하는 표면 위에 구축된다. 로봇 미들웨어는 단일 축의 최적 강제자가 아니라, 이 세 가지를 모두 조합하는 계층으로서 이를 호스팅해야 한다. 우리는 이를 ROS 2 하네스 프로파일이라는 배포 아티팩트로 구상한다. 이 프로파일은 AI 모델이 선언한 출력 영역, 추론 예산, 운영 레짐을 담고 있으며, 미들웨어가 ROS 2, DDS, Zenoh 전반에 걸쳐 이를 강제한다.
주요 기여
이 논문은 다음 분야의 연구를 제시한다:
- cs.RO
- cs.AI
- cs.SE
방법론
자세한 방법론은 전체 논문을 참고하시기 바란다.
실용적 함의
본 연구는 cs.RO 분야의 발전에 기여한다.
저자
- 이상훈
- 채지영
- 박경준
논문 정보
- arXiv ID: 2606.09416v1
- 분류: cs.RO, cs.AI, cs.SE
- 발표일: 2026년 6월 8일
- PDF: PDF 다운로드