[Paper] 加速基于体素的点云网络中的稀疏卷积
Source: arXiv
摘要
稀疏卷积(SpC)为广泛用于自动驾驶和 AR/VR 的 3D 点云网络提供动力。SpC 构建一个 kernel map,存储输入体素坐标、输出坐标和权重偏移之间的映射,然后使用该映射计算输出坐标的特征向量。我们的工作识别出体素坐标的三个关键属性:它们是整数值、在有限的空间范围内受限,并且在几何上是连续的——同一物体表面的相邻体素很可能在空间上只有很小的偏移。现有的 SpC 引擎未能充分利用这些属性,在 kernel map 构建过程中会产生高额的前处理和后处理开销。为了解决这些问题,我们设计了 Spira,首个面向体素属性的 GPU SpC 引擎。Spira 提出:
- 一种高性能的一次性搜索算法,能够在无需预处理且具有高内存局部性的情况下构建 kernel map。
- 一种高效的 packed‑native 处理方案,以低成本访问打包的体素坐标。
- 一种灵活的双数据流执行机制,通过适配层特性高效计算输出特征向量。
- 一种全网并行化策略,在网络启动时并行为所有 SpC 层构建 kernel map。
我们的评估显示,Spira 在端到端推理上平均提升 1.71×,最高可达 2.31×;在层级执行上平均提升 2.13×,最高可达 3.32×,相较于已有的 SpC 引擎有显著优势,且在多种层配置下均表现出色。
主题
- 分布式、并行与集群计算 (cs.DC)
- 硬件体系结构 (cs.AR)
- 机器学习 (cs.LG)
- 性能 (cs.PF)
引用
arXiv:2511.20834 (cs.DC)
DOI
https://doi.org/10.48550/arXiv.2511.20834
提交历史
- v1, Tue, 25 Nov 2025 20:34:37 UTC (602 KB) – Dionysios Adamopoulos