[논문] CANS: 협동형 자가학습 신경외과를 통한 다중 사용자 엣지 추론 가속화
개요
최근 모바일 엣지 컴퓨팅(MEC)을 활용한 협업형 딥 뉴럴 네트워크(DNN) 추론이 자원 제한이 있는 모바일 디바이스에 지능형 서비스를 제공하는 유망한 접근법으로 떠오르고 있습니다. 대표적인 시나리오는 다중 사용자 협업 엣지 추론으로, 각 디바이스가 독립적으로 DNN 모델을 분할하고 무선 네트워크를 통해 공통 엣지 서버에 백엔드 연산을 오프로드합니다. 그러나 무선 링크의 변동성과 디바이스 성능의 다양성 등 시스템 상황이 알려지지 않고 시시각각 변하기 때문에 각 디바이스에 최적의 DNN 파티션을 결정하는 것은 어려운 문제입니다. 이를 해결하기 위해 우리는 Cooperative Autodidactic NeuroSurgeon (CANS) 를 제안합니다. CANS는 디바이스들이 온라인 추론 중에 유용한 피드백을 공유함으로써 최적의 DNN 파티션을 적응적으로 학습하도록 지원하는 협업 엣지 추론 프레임워크입니다. 디바이스 이질성 문제를 다루고 오프라인 추론 경험을 보다 효과적으로 활용하기 위해, 동일 유형 디바이스를 그룹화하고 로컬 오프라인 초기 종료 추론 경험을 이용해 온라인 탐색을 워밍 스타트하는 새로운 FedLinUCB‑DW 알고리즘을 통합했습니다. 또한 FedLinUCB‑DW에 대해 regret 상한을 도출하여 이론적 보장을 제공합니다. 우리는 시뮬레이션 환경과 실제 하드웨어 프로토타입 시스템 모두에서 본 방법을 검증했습니다. 실험 결과 CANS가 최신 최첨단 베이스라인에 비해 추론 지연 시간을 크게 감소시킴을 확인했으며, 특히 두 엣지 디바이스를 이용한 프로토타입 실험에서 비협업 베이스라인 대비 평균 추론 지연 시간을 최대 50%까지 줄였습니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.LG
- cs.AI
- cs.DC
방법론
자세한 방법론은 전체 논문을 참고하시기 바랍니다.
실용적 함의
본 연구는 cs.LG 분야의 발전에 기여합니다.
저자
- Zheshun Wu
- Ziyang Zhang
- Changyao Lin
- Zenglin Xu
- Jie Liu
논문 정보
- arXiv ID: 2606.09175v1
- 분류: cs.LG, cs.AI, cs.DC
- 발표일: 2026년 6월 8일
- PDF: PDF 다운로드