[논문] DeltaBox: 밀리초 수준 샌드박스 체크포인트·롤백으로 상태형 AI 에이전트 확장

발행: 2주 전 (2026년 5월 22일 AM 02:36 GMT+9)

4 분 소요

원문: arXiv

출처: arXiv - 2605.22781v1

개요

LLM 기반 AI 에이전트는 높은 빈도의 상태 탐색(예: 테스트 시점 트리 탐색 및 강화 학습)이 필요하며, 이를 위해 파일과 프로세스 상태(예: 메모리, 컨텍스트 등)를 포함한 전체 샌드박스 상태를 빠르게 체크포인트하고 롤백(C/R)해야 합니다. 기존 메커니즘은 전체 상태를 복제하기 때문에 각 C/R마다 수백 밀리초에서 수초에 달하는 지연이 발생해 깊은 탐색 및 대규모 분기에서 심각한 병목이 됩니다. 본 논문은 AI 에이전트에서 연속적인 체크포인트가 매우 유사하다는 점을 관찰했습니다. 따라서 전체 복제 대신 샌드박스는 연속 체크포인트 간의 변화만 복제하면 된다는 것이 핵심 인사이트입니다. 하지만 운영체제 수준의 지원이 부족해 이를 구현하는 것은 쉽지 않습니다. 이에 우리는 새로운 OS 수준 추상화인 DeltaState를 제안하여 AI 에이전트를 위한 변화 기반 트랜잭션형 C/R을 가능하게 하는 두 가지 공동 설계 OS 메커니즘을 도입합니다. 첫째, DeltaFS는 파일 상태를 레이어로 구성하고 체크포인트 시에 쓰기 가능한 레이어를 동적으로 동결한 뒤 새로운 레이어를 삽입함으로써 파일 업데이트를 copy‑on‑write로 축소하고, 롤백을 단순 레이어 전환으로 처리하는 변화 기반 파일시스템 C/R을 구현합니다. 둘째, DeltaCR은 증분 덤프를 활용해 프로세스 상태 C/R을 변화 기반으로 수행하고, 기존 파이프라인을 우회해 동결된 템플릿 프로세스로부터 직접 fork() 함으로써 롤백 속도를 크게 높입니다. 우리는 이러한 두 메커니즘을 이용해 DeltaBox라는 새로운 에이전트 샌드박스를 제시하며, 이를 통해 밀리초 수준의 C/R을 달성합니다. SWE‑bench와 RL 마이크로 벤치마크에서 수행한 평가 결과, DeltaBox는 체크포인트와 롤백을 각각 14 ms와 5 ms의 지연으로 완료해, 고정된 시간 예산 하에서 에이전트가 탐색할 수 있는 노드 수를 크게 늘릴 수 있음을 보여줍니다.

주요 기여

본 논문은 다음 분야의 연구를 제시합니다.

cs.OS
cs.AI

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.OS 분야의 발전에 기여합니다.

저자

Yunpeng Dong
Jingkai He
Yuze Hou
Dong Du
Zhonghu Xu
Si Yu
Yubin Xia
Haibo Chen

논문 정보

arXiv ID: 2605.22781v1
분류: cs.OS, cs.AI
발표일: 2026년 5월 21일
PDF: PDF 다운로드

[논문] DeltaBox: 밀리초 수준 샌드박스 체크포인트·롤백으로 상태형 AI 에이전트 확장

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[Paper] SkillOpt: 자기 진화형 에이전트 스킬을 위한 실행 전략

[Paper] LLMs as Noisy Channels: Shannon 관점에서 본 Model Capacity와 Scaling Laws

[Paper] 원시 경험에서 스킬 소비까지: Model-Generated Agent Skills에 대한 체계적 연구

[Paper] SPACENUM: VLMs에서 공간 수치 이해 재검토