[논문] 이기종 엣지 클러스터에서 스케줄링 알고리즘의 공정한 비교: 연속 적응 벤치마크

발행: (2026년 6월 11일 AM 02:16 GMT+9)
4 분 소요
원문: arXiv

Source: arXiv - 2606.12343v1

Overview

엣지‑클라우드 연속체의 이질적인 계층에 배포된 최신 인공지능(AI) 워크로드는 지연시간, 처리량, 출력 품질에 대한 다차원 서비스 수준 목표(SLO)를 만족해야 합니다. 각 들어오는 작업에 대해 스케줄러는 목표 노드와 처리 모드(예: 전체 정밀도 추론 또는 축소된 정밀도 추론)를 동시에 선택합니다. 우리는 이러한 문제군을 \emph{Continuous Multi-Mode Scheduling} (CMMS), 즉 연속 다중 모드 스케줄링이라고 부릅니다. 기존 연구들은 각 컨트롤러를 자체 스택에서 단일 워크로드만을 대상으로 평가하고, 의사결정당 오버헤드를 보고하지 않기 때문에 CMMS 알고리즘을 공정하게 비교하기 어렵습니다. 이러한 격차를 메우기 위해 우리는 다음을 갖춘 오픈 소스 벤치마크 플랫폼을 제시합니다: (i) 통합된 컨트롤러 인터페이스, (ii) 다중 워크로드 패턴을 포괄하는 폐쇄 루프 워크로드 드라이버, (iii) 원시 SLO(전체 준수)와 정상 상태 SLO(안정 운영 중 준수)를 별도로 보고하는 이중 메트릭 SLO 점수 체계. 5가지 클러스터 구성과 2가지 부하 체제에서 6개의 컨트롤러를 424 에피소드에 걸쳐 실행한 결과, 컨트롤러 순위는 구성에 크게 의존함을 발견했습니다. 가벼운 부하에서는 딥 강화학습 기반 승자가 우세했지만, 부하가 강화되면 규칙 기반 휴리스틱이 거의 29 퍼센트 포인트 차이로 앞서며, 의사결정당 운영 오버헤드는 약 500배 증가했습니다. 또한 원시 SLO와 정상 상태 SLO를 구분함으로써 단일 종합 점수에서는 감추어질 수 있는 전환 비용을 드러낼 수 있음을 보여줍니다.

Key Contributions

이 논문은 다음 분야의 연구를 제시합니다:

  • cs.DC

Methodology

자세한 방법론은 전체 논문을 참고하십시오.

Practical Implications

본 연구는 cs.DC 분야의 발전에 기여합니다.

Authors

  • Zihang Wang
  • Boris Sedlak
  • Juan Luis Herrera
  • Schahram Dustdar

Paper Information

  • arXiv ID: 2606.12343v1
  • Categories: cs.DC
  • Published: 2026년 6월 10일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »