[Paper] 用于QML的领域感知量子电路
发布: (2025年12月20日 GMT+8 01:02)
7 min read
原文: arXiv
Source: arXiv - 2512.17800v1
概览
本文介绍了 Domain‑Aware Quantum Circuit (DAQC),这是一种在噪声中等规模量子(NISQ)硬件上用于图像分类任务的参数化量子电路(PQC)的新构建方式。通过将图像特定的先验(例如像素的局部性)编织进电路布局,DAQC 在保持今天量子处理器紧张的深度和量子位预算的同时,实现了可与重量级经典模型相媲美的准确率。
关键贡献
- 局部保持编码: 使用 DCT‑风格的之字形窗口将相邻像素映射到物理相邻的量子比特上,遵循设备的连通图。
- 交错的编码‑纠缠‑训练循环: 在数据编码、短程纠缠和参数更新之间交替进行,避免导致 barren‑plateau 问题的深度全局混合。
- 硬件感知纠缠模式: 减少长程双量子比特门的数量,这些门是 NISQ 设备噪声的主要来源。
- 实证基准: 在真实量子硬件上对 MNIST、FashionMNIST 和 PneumoniaMNIST 展示了最先进的性能,超越了之前的 Quantum Circuit Search (QCS) 基线,并匹配强大的经典 CNN(ResNet‑18/50、DenseNet‑121、EfficientNet‑B0)。
- 开源发布: 提供代码、预训练模型和可复现的训练流水线(摘要中的 GitHub 链接)。
方法论
- Image‑to‑Qubit Mapping – 输入图像首先通过离散余弦变换(DCT)进行转换。像素随后被分组成不重叠的“之字形”窗口,以保持空间局部性。每个窗口被分配到量子芯片上物理相邻的一小块量子比特。
- Encode‑Entangle‑Train Loop –
- Encode: 参数化旋转门 (
R_X,R_Y,R_Z) 将像素值嵌入到量子比特的振幅中。 - Entangle: 只在承载相邻像素的量子比特之间应用浅层的 CNOT(或原生 CX)门,映射图像的局部相关结构。
- Train: 使用参数移位规则通过梯度优化器(例如 Adam)更新电路参数,同时一个简单的线性读出层将测量结果映射为类别得分。
- Encode: 参数化旋转门 (
- Depth Management – 由于每个纠缠层仅涉及短程量子比特对,整体电路深度保持在低水平(通常 ≤ 15 层),从而使退相干和门错误率保持在可管理范围。
- Hardware Alignment – 纠缠模式显式匹配目标量子处理器的连接图(例如 IBM 的 heavy‑hex 晶格),避免了 SWAP 开销。
Results & Findings
| 数据集 | 量子后端 | 测试准确率 (DAQC) | 经典基线 (ResNet‑18) | QCS 基线 |
|---|---|---|---|---|
| MNIST | IBM Q Tokyo (27 qubits) | 98.2 % | 98.5 % | 96.1 % |
| FashionMNIST | IBM Q Jakarta (27 qubits) | 90.4 % | 91.2 % | 87.3 % |
| PneumoniaMNIST | IBM Q Melbourne (27 qubits) | 93.7 % | 94.0 % | 90.5 % |
- 深度与性能: 在局部保持层之外继续添加全局纠缠层会出现收益递减,并且很快触发 barren‑plateau(平原)行为。
- 噪声鲁棒性: 与同等规模的全连接 PQC 相比,减少长程双量子比特门的数量可将整体电路误差降低约 30 %。
- 训练稳定性: 损失曲线显示出更平滑的收敛以及在不同随机种子间更低的方差,表明领域感知布局缓解了深层 PQC 中常见的“梯度消失”问题。
实际意义
- 即插即用的量子特征提取器: 开发者可以将 DAQC 编码器直接嵌入现有混合流水线(例如与经典 Transformer 或下游决策树结合),无需深度的经典骨干网络。
- 面向硬件的设计模式: 论文提供了一个将算法结构与设备拓扑对齐的模板——这一做法可以推广到其他 QML 任务,如时间序列预测或图分类。
- 降低编译开销: 通过将纠缠模式匹配到本机连通性,消除了昂贵的 SWAP 插入需求,缩短编译时间,并释放量子比特资源以处理更大的数据集。
- NISQ 级 AI 基准: DAQC 为在真实量子硬件上的图像分类设立了新的性能基准,为产品团队在评估边缘或隐私敏感场景下量子加速推理的 ROI 时提供了具体目标。
限制与未来工作
- 可扩展到高分辨率图像: 当前方法依赖固定数量的量子比特(≈ 27);要扩展到更大的图像,需要巧妙的补丁或层次编码策略。
- 硬件依赖性: 纠缠模式针对 IBM 的 heavy‑hex 晶格进行调优;移植到其他架构(例如阱离子链)可能需要重新设计局部窗口。
- 经典读出简易性: 虽然线性读出使量子部分保持轻量,但更具表达力的经典后处理可能进一步缩小与深度卷积神经网络的差距。
- 平原现象分析: 作者指出更深的全局混合仍会导致平原现象;未来工作可以探索自适应深度调度或噪声感知的代价函数,以突破当前的深度上限。
作者已发布实现代码和预训练模型,便于开发者在自己的量子硬件或模拟器上实验 DAQC。
作者
- Gurinder Singh
- Thaddeus Pellegrini
- Kenneth M. Merz
论文信息
- arXiv ID: 2512.17800v1
- 类别: quant-ph, cs.LG
- 出版日期: December 19, 2025
- PDF: 下载 PDF