[Paper] 量子多重旋转平均

发布: 2天前 (2026年2月11日 GMT+8 02:59)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.10115v1

概述

本文提出了 IQARS (Iterative Quantum Annealing for Rotation Synchronization)，这是一种新颖的解决多旋转平均（MRA）问题的方法，该问题是许多 3‑D 视觉和机器人流水线的基础。通过将 MRA 重新表述为一系列可在量子退火器上运行的二元二次子问题，作者展示了相较于当今最强大的经典求解器，准确度的显著提升。

关键贡献

首个量子退火形式化的 MRA – 将连续的旋转同步任务转化为一系列适用于 D‑Wave 风格硬件的二元二次问题。
迭代细化管线 (IQARS) – 反复求解局部二次、非凸子问题，保持真实的 SO(3) 流形几何，而不依赖凸松弛。
优越精度的实证证据 – 在合成基准和真实数据集上，IQARS 的旋转估计精度比评估的最佳经典基线 Shonan 高约 12 %。
对量子硬件约束的公开讨论 – 工作阐述了实际限制（问题规模、量子比特连通性、噪声），并提供了随着退火器成熟的扩展路线图。

方法论

Problem Binarization – 连续的旋转变量被离散化为二进制自旋变量，采用精心设计的编码以保持 SO(3) 结构。
Local Quadratic Sub‑Problems – 与其一次性处理完整的非凸 MRA 目标，IQARS 将其拆分为一系列局部二次子问题，每个子问题捕获旋转图的一个小片段（例如，少数相邻相机）。
Quantum Annealing Execution – 将每个子问题提交给 D‑Wave 量子退火器，利用量子隧穿和大规模并行搜索低能自旋配置。
Iterative Update & Re‑linearization – 将二进制解码回旋转估计，在该估计附近重新线性化全局目标，并重复该过程直至收敛。
Hybrid Classical Post‑Processing – 通过轻量级的经典精化（例如，若干 IRLS 步骤）消除残余误差，确保最终旋转严格位于 SO(3) 流形上。

该流水线刻意保持模块化：开发者可以将量子后端替换为经典模拟退火器或 GPU 加速的 QUBO 求解器，以实验速度与解质量之间的权衡。

结果与发现

数据集	指标（平均旋转误差）	经典最佳（Shonan）	IQARS（D‑Wave）
合成低噪声	0.42°	0.45°	0.40°
合成高噪声	2.31°	2.61°	2.30°
真实世界结构光束（COLMAP）	1.78°	2.02°	1.77°

精度提升： 在所有数据集上，IQARS 将平均旋转误差降低约 12 %，相较于 Shonan。
对噪声的鲁棒性： 在高噪声环境下优势更为明显，因为凸松弛方法往往会失效。
运行时间： 对于适配当前硬件的规模（≤ 150 个旋转，≤ 300 条相对测量），量子退火步骤每次迭代耗时 0.5–2 秒，约等于现代 CPU 上几次 IRLS 迭代的时间。
可扩展性观察： 当问题规模超出量子比特数量或连通性限制时，作者采用问题分解方法，虽带来适度的开销，但仍保持精度优势。

Practical Implications

改进的 3‑D 重建流水线 – 更精确的旋转估计直接转化为更紧密的点云对齐、更少的离群点以及更高质量的网格，适用于 AR/VR、自动驾驶导航和文化遗产数字化。
机器人技术与 SLAM – 精确的姿态同步可以降低多机器人群或长期 SLAM 会话中因环路闭合噪声导致的漂移。
混合量子‑经典工具链 – IQARS 展示了一个具体的用例：量子退火器可以作为黑箱优化器嵌入现有的 C++/Python 视觉栈，实现“量子加速”而无需重写整个流水线。
量子硬件的前瞻性布局 – 随着退火器规模扩展到数千个量子比特并提升连通性，同一 IQARS 框架能够以最小的算法改动处理更大的摄像头网络（例如城市尺度的摄影测量）。

对实验感兴趣的开发者可以从作者提供的开源 QUBO 公式入手，在 D‑Wave 的 Leap 云服务上运行，并与自己代码库中的基线 IRLS 实现进行对比。

限制与未来工作

硬件约束: 当前 D‑Wave 设备仅支持几百个二进制变量且连通性受限，限制了在一次退火调用中可求解的旋转图规模。
编码开销: 离散化步骤会引入近似误差；虽然迭代方案可以减轻该误差，但更紧凑的编码仍可进一步提升结果。
基准范围: 实验主要针对合成数据和中等规模的真实数据集；大规模 Structure‑from‑Motion（数千视图）尚未进行测试。
混合策略: 作者建议将量子退火与经典 SDP 松弛或 GPU 加速的 QUBO 求解器结合，以在硬件成熟之前弥合差距。

总体而言，本文将量子退火定位为计算机视觉和机器人领域核心问题的有前景（但仍处于早期阶段）的加速器，为开发者提供了一条切实可行的路径，能够立即尝试量子增强优化。

作者

Shuteng Wang
Natacha Kuete Meli
Michael Möller
Vladislav Golyanik

论文信息

arXiv ID: 2602.10115v1
类别: cs.CV
出版日期: 2026年2月10日
PDF: 下载 PDF

[Paper] 量子多重旋转平均

概述

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] 惊喜之笔：渐进式语义幻觉在 Vector Sketching 中

[Paper] UniT：统一多模态链式思考测试时扩展

[Paper] MonarchRT：高效注意力用于实时视频生成

[Paper] 面向 On-Policy SFT：分布判别理论及其在 LLM 训练中的应用