[Paper] 量子多重旋转平均

发布: (2026年2月11日 GMT+8 02:59)
8 分钟阅读
原文: arXiv

Source: arXiv - 2602.10115v1

概述

本文提出了 IQARS (Iterative Quantum Annealing for Rotation Synchronization),这是一种新颖的解决多旋转平均(MRA)问题的方法,该问题是许多 3‑D 视觉和机器人流水线的基础。通过将 MRA 重新表述为一系列可在量子退火器上运行的二元二次子问题,作者展示了相较于当今最强大的经典求解器,准确度的显著提升。

关键贡献

  • 首个量子退火形式化的 MRA – 将连续的旋转同步任务转化为一系列适用于 D‑Wave 风格硬件的二元二次问题。
  • 迭代细化管线 (IQARS) – 反复求解局部二次、非凸子问题,保持真实的 SO(3) 流形几何,而不依赖凸松弛。
  • 优越精度的实证证据 – 在合成基准和真实数据集上,IQARS 的旋转估计精度比评估的最佳经典基线 Shonan 高约 12 %
  • 对量子硬件约束的公开讨论 – 工作阐述了实际限制(问题规模、量子比特连通性、噪声),并提供了随着退火器成熟的扩展路线图。

方法论

  1. Problem Binarization – 连续的旋转变量被离散化为二进制自旋变量,采用精心设计的编码以保持 SO(3) 结构。
  2. Local Quadratic Sub‑Problems – 与其一次性处理完整的非凸 MRA 目标,IQARS 将其拆分为一系列 局部 二次子问题,每个子问题捕获旋转图的一个小片段(例如,少数相邻相机)。
  3. Quantum Annealing Execution – 将每个子问题提交给 D‑Wave 量子退火器,利用量子隧穿和大规模并行搜索低能自旋配置。
  4. Iterative Update & Re‑linearization – 将二进制解码回旋转估计,在该估计附近重新线性化全局目标,并重复该过程直至收敛。
  5. Hybrid Classical Post‑Processing – 通过轻量级的经典精化(例如,若干 IRLS 步骤)消除残余误差,确保最终旋转严格位于 SO(3) 流形上。

该流水线刻意保持模块化:开发者可以将量子后端替换为经典模拟退火器或 GPU 加速的 QUBO 求解器,以实验速度与解质量之间的权衡。

结果与发现

数据集指标(平均旋转误差)经典最佳(Shonan)IQARS(D‑Wave)
合成低噪声0.42°0.45°0.40°
合成高噪声2.31°2.61°2.30°
真实世界结构光束(COLMAP)1.78°2.02°1.77°
  • 精度提升: 在所有数据集上,IQARS 将平均旋转误差降低约 12 %,相较于 Shonan。
  • 对噪声的鲁棒性: 在高噪声环境下优势更为明显,因为凸松弛方法往往会失效。
  • 运行时间: 对于适配当前硬件的规模(≤ 150 个旋转,≤ 300 条相对测量),量子退火步骤每次迭代耗时 0.5–2 秒,约等于现代 CPU 上几次 IRLS 迭代的时间。
  • 可扩展性观察: 当问题规模超出量子比特数量或连通性限制时,作者采用问题分解方法,虽带来适度的开销,但仍保持精度优势。

Practical Implications

  • 改进的 3‑D 重建流水线 – 更精确的旋转估计直接转化为更紧密的点云对齐、更少的离群点以及更高质量的网格,适用于 AR/VR、自动驾驶导航和文化遗产数字化。
  • 机器人技术与 SLAM – 精确的姿态同步可以降低多机器人群或长期 SLAM 会话中因环路闭合噪声导致的漂移。
  • 混合量子‑经典工具链 – IQARS 展示了一个具体的用例:量子退火器可以作为黑箱优化器嵌入现有的 C++/Python 视觉栈,实现“量子加速”而无需重写整个流水线。
  • 量子硬件的前瞻性布局 – 随着退火器规模扩展到数千个量子比特并提升连通性,同一 IQARS 框架能够以最小的算法改动处理更大的摄像头网络(例如城市尺度的摄影测量)。

对实验感兴趣的开发者可以从作者提供的开源 QUBO 公式入手,在 D‑Wave 的 Leap 云服务上运行,并与自己代码库中的基线 IRLS 实现进行对比。

限制与未来工作

  • 硬件约束: 当前 D‑Wave 设备仅支持几百个二进制变量且连通性受限,限制了在一次退火调用中可求解的旋转图规模。
  • 编码开销: 离散化步骤会引入近似误差;虽然迭代方案可以减轻该误差,但更紧凑的编码仍可进一步提升结果。
  • 基准范围: 实验主要针对合成数据和中等规模的真实数据集;大规模 Structure‑from‑Motion(数千视图)尚未进行测试。
  • 混合策略: 作者建议将量子退火与经典 SDP 松弛或 GPU 加速的 QUBO 求解器结合,以在硬件成熟之前弥合差距。

总体而言,本文将量子退火定位为计算机视觉和机器人领域核心问题的有前景(但仍处于早期阶段)的加速器,为开发者提供了一条切实可行的路径,能够立即尝试量子增强优化。

作者

  • Shuteng Wang
  • Natacha Kuete Meli
  • Michael Möller
  • Vladislav Golyanik

论文信息

  • arXiv ID: 2602.10115v1
  • 类别: cs.CV
  • 出版日期: 2026年2月10日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »