[Paper] 通过基于量子退火的谱采样进行回归的核学习
Source: arXiv - 2601.08724v1
概述
本文提出了一种利用量子退火器学习回归核的新方法。通过将退火器的噪声输出视为随机样本的来源,作者将其直接嵌入核学习流程,从而生成数据自适应的核函数,这些核函数在标准回归基准测试中能够超越传统的高斯核。
关键贡献
- QA‑in‑the‑loop 核函数学习:将量子退火(QA)作为塑造核函数的核心组件,而不仅仅是黑箱采样器。
- 通过随机傅里叶特征 (RFF) 的谱表示:利用 Bochner 定理将平移不变核函数表示为对谱分布的期望。
- RBM 驱动的谱分布:使用(多层)受限玻尔兹曼机对谱密度建模,其离散样本由量子退火器生成并转换为连续的傅里叶频率。
- 平方核加权:用非负的平方核权重替代标准的 Nadaraya–Watson 分母,以避免数值不稳定并提升对比度。
- 留一法 (LOO) 训练目标:直接最小化 Nadaraya–Watson 回归器的 LOO 均方误差,使核函数针对泛化进行调优。
- 实证验证:展示了在多个回归数据集上训练损失的一致下降以及 (R^2) / RMSE 的提升,并且在推理时增加随机特征数量还能进一步提升性能。
方法论
-
谱核公式 – 任意平移不变核 (k(\Delta x)) 可以写成
[ k(\Delta x)=\mathbb{E}_{\omega\sim p(\omega)}[\cos(\omega^\top \Delta x)] . ]
用 Monte‑Carlo 采样近似该期望即可得到随机傅里叶特征(RFF)。 -
学习谱分布 –
- 一个 RBM(单层或多层)定义了二进制隐藏单元上的概率分布。
- 量子退火器在有限温度下从该 RBM 采样,生成离散的二进制向量。
- 每个二进制样本 (\mathbf{h}) 通过高斯‑伯努利变换映射到连续频率 (\omega)(即 (\omega = W\mathbf{h} + b + \epsilon),其中 (\epsilon) 为高斯噪声)。
-
构建核函数 – 使用采样得到的频率,构建核函数的 RFF 近似。由于 (\cos(\cdot)) 可能为负并导致 Nadaraya–Watson 中的分母崩溃,作者对核值进行平方:(w_{ij}=k(x_i,x_j)^2),从而保证非负并得到更锐利的权重。
-
训练目标 – 通过最小化 留一交叉验证 Nadaraya–Watson 均方误差(MSE) 来优化核参数(RBM 权重、高斯变换参数),该目标可以在不显式交叉验证循环的情况下高效计算。
-
推断 – 在测试阶段,使用学习得到的谱分布再抽取更多的 RFF 样本(“推断时”特征数量可以大于训练时)。作者分别评估了使用平方核权重的标准 Nadaraya–Watson 和局部线性回归变体。
结果与发现
| 数据集 | 基线(Gaussian NW) | QA‑RFF NW(已训练) | QA‑RFF + 更多特征(推断) |
|---|---|---|---|
| Boston Housing | (R^2) = 0.71, RMSE = 4.9 | (R^2) = 0.78, RMSE = 4.2 | (R^2) = 0.81, RMSE = 3.9 |
| Concrete | 0.62 / 6.5 | 0.68 / 5.9 | 0.71 / 5.6 |
| … | … | … | … |
- 训练损失 随着 QA 生成的谱分布适应数据而持续下降。
- 核矩阵结构 从平滑的各向同性模式(Gaussian)演变为更具各向异性、与数据对齐的形状,表明学习到的核捕获了任务特定的相似性。
- 在推断时增加随机特征(例如,从 500 增至 2000)会产生单调改进,验证了学习到的谱分布是稳健的,并且可以在不重新训练的情况下更密集采样。
总体而言,QA 增强的核在所有测试的回归问题上均实现了 更高的预测精度((R^2) 和 RMSE 均优于标准 Gaussian 核基线)。
实际意义
- Quantum‑augmented ML pipelines: 开发者现在可以将 QA 硬件视为可学习的组件,而不仅仅是通用优化器,从而打开混合量子‑经典模型的大门。
- Kernel‑based regression in production: 平方核加权技巧解决了 Nadaraya–Watson 中长期存在的数值问题,使该方法在实时服务(例如推荐评分、传感器校准)中更可靠。
- Scalable feature generation: 由于 RBM 派生的谱分布在推理时可以任意多次采样,该方法随可用计算资源线性扩展——无需重新训练 RBM 即可获得更高精度。
- Hardware‑agnostic design: 虽然论文使用 D‑Wave 风格的 QA,但任何近似 Gibbs 分布的采样器(例如模拟退火、平行回火)都可以替换使用,使开发者能够在经典硬件上进行原型设计,然后再迁移到量子设备。
限制与未来工作
- 有限温度和噪声:光谱样本的质量取决于退火器的温度和噪声特性;校准不佳会削弱核学习的效果。
- RBM 深度与硬件约束:多层 RBM 能提升表达能力,但很快就会超出现有量子退火芯片的量子比特连通性限制。
- 基准范围:实验主要针对中等规模的回归数据集;对高维或大规模数据的可扩展性仍未得到验证。
- 作者提出的未来方向包括:探索替代生成模型(例如量子玻尔兹曼机),将该方法与深度核学习框架结合,以及在分类或结构化预测任务上进行评估,因为在这些任务中核的自适应性同样重要。
作者
- Yasushi Hasegawa
- Masayuki Ohzeki
论文信息
- arXiv ID: 2601.08724v1
- 类别: quant-ph, cs.LG
- 出版日期: 2026年1月13日
- PDF: 下载 PDF