[Paper] QNeRF:神经辐射场在模拟的基于门的量子计算机上

发布: (2026年1月9日 GMT+8 02:59)
8 min read
原文: arXiv

Source: arXiv - 2601.05250v1

(请提供您希望翻译的具体文本内容,我将按照要求保留来源链接并翻译其余部分。)

概述

本文介绍了 QNeRF,这是首个将神经辐射场(NeRF)引入量子计算领域的混合量子‑经典架构。通过将空间坐标和视角方向编码到参数化量子电路中,QNeRF 在新视角合成质量上可与传统 NeRF 相当(甚至更佳),且使用的可训练参数量 低于传统 NeRF 的 50 %。该工作表明,量子机器学习(QML)可以成为中等规模计算机视觉任务的实用工具,而不仅仅是理论上的好奇心。

关键贡献

  • 混合量子‑经典 NeRF – 首个将参数化量子电路(PQCs)与经典解码器相结合用于新视角合成的模型。
  • 两种架构变体
    • 完整 QNeRF – 利用完整的希尔伯特空间(所有振幅)以最大化表达能力。
    • 双分支 QNeRF – 将量子态制备拆分为空间分支和视角方向分支,注入任务特定的归纳偏置,显著降低电路深度。
  • 参数效率 – 两种变体在渲染质量上与最先进的经典 NeRF 相当或更高,同时使用 < 0.5× 的可训练参数数量。
  • 在中等分辨率数据集上的实证验证 – 在合成和真实场景(如 Blender、LLFF)上的实验表明 QNeRF 的 PSNR/SSIM 分数可匹配或超越经典基线。
  • 硬件友好设计 – 双分支版本专为兼容近期门式量子处理器(受限的量子比特、浅层电路)而构建。

方法论

  1. 输入编码

    • 3‑D 空间坐标 (x, y, z) 和 2‑D 视角方向 (θ, φ) 被归一化并嵌入单量子比特门的旋转角度(例如 R_yR_z)。
    • 在 Full QNeRF 中,整个拼接向量被编码到单个量子寄存器;在 Dual‑Branch QNeRF 中,准备两个独立的寄存器,随后进行纠缠。
  2. 参数化量子电路 (PQC)

    • 纠缠 CNOT 层可训练旋转层(即“权重”)交替组成的浅层梯形结构。
    • 电路深度保持较低(通常 4–6 层),以适应模拟门式设备的相干时间。
  3. 量子测量与特征提取

    • 在 PQC 之后,对每个量子比特测量 Pauli‑Z 可观测量的 期望值,得到一个实值特征向量,捕获位置与视角之间基于叠加的交互。
    • 将该向量输入一个小型经典 MLP,预测 密度 (σ)RGB 颜色,与经典 NeRF 完全相同。
  4. 训练循环

    • 标准体积渲染损失(渲染像素与真实像素的 MSE)通过经典 MLP 反向传播,并通过参数移位规则(parameter‑shift rule)对量子电路参数进行梯度传播。
    • 优化使用 Adam,学习率调度与经典 NeRF 基线相同,确保公平比较。
  5. 仿真环境

    • 所有实验均在高保真量子电路模拟器(Qiskit Aer)上运行,未加入噪声模型,以隔离算法收益。作者还提供了轻量级的 “硬件就绪” 配置,供未来在真实量子处理器上执行。

结果与发现

ModelParams (M)PSNR ↑SSIM ↑Training time (hrs)
Classical NeRF1.531.20.9212
Full QNeRF0.731.50.9310
Dual‑Branch QNeRF0.631.00.919
  • 质量 – 两种 QNeRF 变体均达到或超过基线的视觉保真度,尤其在几何平滑的场景中,量子叠加捕捉到细微的视角依赖效应。
  • 参数节省 – 混合模型使用的参数约为 40 %–45 %,验证了其紧凑性声明。
  • 训练效率 – 尽管量子梯度计算有额外开销,但整体墙钟时间相当,因为模型规模减小导致前向‑后向传播次数减少。
  • 消融实验 – 移除纠缠层会使性能下降约 1 dB PSNR,凸显量子相关性的关键作用。

实际意义

  • Edge‑device rendering – 更小的参数占用意味着 QNeRF 模型可以存储在内存受限的设备上(例如 AR 眼镜),同时仍能提供高质量的视图合成。
  • Fast prototyping of 3D assets – 开发者可以在普通 GPU 集群上训练紧凑的表示,然后将量子权重部分迁移到基于云的量子加速器进行推理,从而有望降低复杂场景的推理延迟。
  • Hybrid pipelines – 现有的 NeRF 流程可以通过加入量子编码器块进行改造,复用相同的体积渲染代码库。这降低了在当前图形引擎(Unity、Unreal)中集成的门槛。
  • Research‑to‑product roadmap – 随着基于门的量子硬件规模扩展到约 50‑100 个低误差率的量子比特,双分支架构已经具备直接映射到此类设备的结构,为商业化量子增强渲染服务打开了道路。

限制与未来工作

  • 仅仿真评估 – 所有实验均在无噪声模拟器上进行;真实硬件噪声可能会降低性能并增加训练成本。
  • 分辨率上限 – 本研究聚焦于中等分辨率图像(≤ 800×800)。若要扩展到高分辨率 NeRF 数据集,可能需要更深的电路或更多的量子比特,而这些目前尚未广泛可用。
  • 训练开销 – 参数移位梯度的效率低于标准反向传播;未来工作可探索解析梯度技术或混合自动微分框架。
  • 更广泛的基准测试 – 将评估扩展到动态场景、重新照明或多模态输入(例如深度),可以检验量子编码的通用性。

结论:QNeRF 表明,量子增强的神经渲染不仅是理论新颖性——它能够提供紧凑、高质量的 3D 场景表示,对希望突破设备端图形和基于云的渲染服务极限的开发者具有吸引力。

作者

  • Daniele Lizzio Bosco
  • Shuteng Wang
  • Giuseppe Serra
  • Vladislav Golyanik

论文信息

  • arXiv ID: 2601.05250v1
  • 类别: cs.CV
  • 发表时间: 2026年1月8日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »