[논문] SET: 효율적인 CUDA 그래프 파이프라인을 위한 스트림·이벤트 기반 스케줄링
Source: arXiv - 2606.05495v1
개요
GPU 성능을 최대치로 끌어올리는 일은 여전히 큰 도전 과제이다. 시스템 처리량은 호스트와 디바이스 간 동기화 지연 및 커널 스케줄링 오버헤드에 의해 제한되며, 이는 공격적인 커널 최적화와 배치 처리에도 불구하고 마찬가지이다. 또한 기존 접근 방식은 스케줄링 오버헤드 때문에 연산 코어와 복사 엔진 같은 하드웨어 자원을 충분히 활용하지 못한다. 이러한 문제를 해결하기 위해 우리는 동기화 오버헤드와 커널 실행 간 간격을 최소화하는 작업‑병렬 파이프라인을 위한 CUDA 런타임 프레임워크를 제안한다. 제안된 솔루션은 두 가지 혁신을 결합한다: (1) 이벤트 체이닝과 워크‑스틸링 메커니즘을 활용해 사용 가능한 하드웨어 자원을 완전히 활용하는 다중 스트림 작업‑병렬 파이프라인 프로그래밍 모델; (2) 여러 개의 인플라이트 작업이 동시에 실행될 때 메모리 안전성을 보장하는 스트림별 버퍼를 갖춘 그래프 기반 실행 흐름. 실제 워크로드에 대한 광범위한 평가 결과, 최첨단 CUDA 그래프 기반 베이스라인에 비해 1.15‒1.44배의 속도 향상과 18‒54%의 스케줄링 오버헤드 감소를 확인하였다.
주요 기여
본 논문은 다음 분야의 연구를 제시한다:
- cs.DC
- cs.AR
방법론
자세한 방법론은 전체 논문을 참고하시기 바란다.
실용적 함의
본 연구는 cs.DC 분야의 발전에 기여한다.
저자
- Zhengxiong Li
- Tsung-Wei Huang
- Umit Ogras
논문 정보
- arXiv ID: 2606.05495v1
- 분류: cs.DC, cs.AR
- 발표일: 2026년 6월 3일
- PDF: PDF 다운로드