[Paper] 量子多重旋转平均
发布: (2026年2月11日 GMT+8 02:59)
8 分钟阅读
原文: arXiv
Source: arXiv - 2602.10115v1
概述
本文提出了 IQARS (Iterative Quantum Annealing for Rotation Synchronization),这是一种新颖的解决多旋转平均(MRA)问题的方法,该问题是许多 3‑D 视觉和机器人流水线的基础。通过将 MRA 重新表述为一系列可在量子退火器上运行的二元二次子问题,作者展示了相较于当今最强大的经典求解器,准确度的显著提升。
关键贡献
- 首个量子退火形式化的 MRA – 将连续的旋转同步任务转化为一系列适用于 D‑Wave 风格硬件的二元二次问题。
- 迭代细化管线 (IQARS) – 反复求解局部二次、非凸子问题,保持真实的 SO(3) 流形几何,而不依赖凸松弛。
- 优越精度的实证证据 – 在合成基准和真实数据集上,IQARS 的旋转估计精度比评估的最佳经典基线 Shonan 高约 12 %。
- 对量子硬件约束的公开讨论 – 工作阐述了实际限制(问题规模、量子比特连通性、噪声),并提供了随着退火器成熟的扩展路线图。
方法论
- Problem Binarization – 连续的旋转变量被离散化为二进制自旋变量,采用精心设计的编码以保持 SO(3) 结构。
- Local Quadratic Sub‑Problems – 与其一次性处理完整的非凸 MRA 目标,IQARS 将其拆分为一系列 局部 二次子问题,每个子问题捕获旋转图的一个小片段(例如,少数相邻相机)。
- Quantum Annealing Execution – 将每个子问题提交给 D‑Wave 量子退火器,利用量子隧穿和大规模并行搜索低能自旋配置。
- Iterative Update & Re‑linearization – 将二进制解码回旋转估计,在该估计附近重新线性化全局目标,并重复该过程直至收敛。
- Hybrid Classical Post‑Processing – 通过轻量级的经典精化(例如,若干 IRLS 步骤)消除残余误差,确保最终旋转严格位于 SO(3) 流形上。
该流水线刻意保持模块化:开发者可以将量子后端替换为经典模拟退火器或 GPU 加速的 QUBO 求解器,以实验速度与解质量之间的权衡。
结果与发现
| 数据集 | 指标(平均旋转误差) | 经典最佳(Shonan) | IQARS(D‑Wave) |
|---|---|---|---|
| 合成低噪声 | 0.42° | 0.45° | 0.40° |
| 合成高噪声 | 2.31° | 2.61° | 2.30° |
| 真实世界结构光束(COLMAP) | 1.78° | 2.02° | 1.77° |
- 精度提升: 在所有数据集上,IQARS 将平均旋转误差降低约 12 %,相较于 Shonan。
- 对噪声的鲁棒性: 在高噪声环境下优势更为明显,因为凸松弛方法往往会失效。
- 运行时间: 对于适配当前硬件的规模(≤ 150 个旋转,≤ 300 条相对测量),量子退火步骤每次迭代耗时 0.5–2 秒,约等于现代 CPU 上几次 IRLS 迭代的时间。
- 可扩展性观察: 当问题规模超出量子比特数量或连通性限制时,作者采用问题分解方法,虽带来适度的开销,但仍保持精度优势。
Practical Implications
- 改进的 3‑D 重建流水线 – 更精确的旋转估计直接转化为更紧密的点云对齐、更少的离群点以及更高质量的网格,适用于 AR/VR、自动驾驶导航和文化遗产数字化。
- 机器人技术与 SLAM – 精确的姿态同步可以降低多机器人群或长期 SLAM 会话中因环路闭合噪声导致的漂移。
- 混合量子‑经典工具链 – IQARS 展示了一个具体的用例:量子退火器可以作为黑箱优化器嵌入现有的 C++/Python 视觉栈,实现“量子加速”而无需重写整个流水线。
- 量子硬件的前瞻性布局 – 随着退火器规模扩展到数千个量子比特并提升连通性,同一 IQARS 框架能够以最小的算法改动处理更大的摄像头网络(例如城市尺度的摄影测量)。
对实验感兴趣的开发者可以从作者提供的开源 QUBO 公式入手,在 D‑Wave 的 Leap 云服务上运行,并与自己代码库中的基线 IRLS 实现进行对比。
限制与未来工作
- 硬件约束: 当前 D‑Wave 设备仅支持几百个二进制变量且连通性受限,限制了在一次退火调用中可求解的旋转图规模。
- 编码开销: 离散化步骤会引入近似误差;虽然迭代方案可以减轻该误差,但更紧凑的编码仍可进一步提升结果。
- 基准范围: 实验主要针对合成数据和中等规模的真实数据集;大规模 Structure‑from‑Motion(数千视图)尚未进行测试。
- 混合策略: 作者建议将量子退火与经典 SDP 松弛或 GPU 加速的 QUBO 求解器结合,以在硬件成熟之前弥合差距。
总体而言,本文将量子退火定位为计算机视觉和机器人领域核心问题的有前景(但仍处于早期阶段)的加速器,为开发者提供了一条切实可行的路径,能够立即尝试量子增强优化。
作者
- Shuteng Wang
- Natacha Kuete Meli
- Michael Möller
- Vladislav Golyanik
论文信息
- arXiv ID: 2602.10115v1
- 类别: cs.CV
- 出版日期: 2026年2月10日
- PDF: 下载 PDF