[Paper] Voxel 기반 포인트 클라우드 네트워크에서 Sparse Convolutions 가속화
Source: arXiv
Abstract
Sparse Convolution (SpC) 은 자율 주행 및 AR/VR에 널리 사용되는 3D 포인트 클라우드 네트워크에 동력을 제공합니다. SpC 는 입력 voxel 좌표, 출력 좌표, 그리고 가중치 오프셋 사이의 매핑을 저장하는 커널 맵을 구축한 뒤, 이 맵을 사용해 출력 좌표에 대한 특징 벡터를 계산합니다. 우리의 연구는 voxel 좌표의 세 가지 핵심 특성을 확인합니다: 정수값이며, 제한된 공간 범위 내에 제한되고, 기하학적으로 연속적이라는 점—같은 객체 표면상의 인접 voxel은 서로 작은 공간 오프셋을 두고 존재할 가능성이 높습니다. 기존 SpC 엔진은 이러한 특성을 충분히 활용하지 못하고, 커널 맵 구축 과정에서 높은 전처리 및 후처리 오버헤드를 겪습니다. 이를 해결하기 위해 우리는 GPU용 최초의 voxel‑특성 인식 SpC 엔진인 Spira 를 설계했습니다. Spira 는 다음을 제안합니다:
- 전처리 없이 고 메모리 지역성을 갖는 커널 맵을 구축하는 고성능 원샷 탐색 알고리즘.
- 낮은 비용으로 패킹된 voxel 좌표에 접근하는 효과적인 패킹‑네이티브 처리 방식.
- 레이어 특성에 맞춰 출력 특징 벡터를 효율적으로 계산하는 유연한 이중‑데이터플로우 실행 메커니즘.
- 네트워크 시작 시 모든 SpC 레이어에 대해 커널 맵을 동시에 구축하는 네트워크‑전체 병렬화 전략.
우리의 평가 결과, Spira 는 기존 SpC 엔진에 비해 평균 1.71배, 최악의 경우 2.31배까지 엔드‑투‑엔드 추론에서, 그리고 다양한 레이어 구성에서 레이어‑별 실행 시 평균 2.13배, 최악의 경우 3.32배까지 크게 향상됨을 보여줍니다.
Subjects
- Distributed, Parallel, and Cluster Computing (cs.DC)
- Hardware Architecture (cs.AR)
- Machine Learning (cs.LG)
- Performance (cs.PF)
Citation
arXiv:2511.20834 (cs.DC)
DOI
https://doi.org/10.48550/arXiv.2511.20834
Submission History
- v1, Tue, 25 Nov 2025 20:34:37 UTC (602 KB) – Dionysios Adamopoulos