是什么让量子机器学习“量子”?
Source: Towards Data Science
Introduction
我在完成硕士学位后七年前开始从事量子计算工作。那时,整个领域充满了兴奋——但也伴随着怀疑。如今,量子计算已与**高性能计算(HPC)和人工智能(AI)**并列,成为新兴技术。
研究重点已从纯粹以硬件为中心的研究转向应用、软件和算法。量子计算机现在被视为可以在众多学科中加以利用的工具,而不再是一个孤立的细分领域。量子计算机最有前景(但仍未完全被理解)的应用之一是量子机器学习(QML)。
什么是量子机器学习?
量子机器学习 在过去几年里已经成为一个包罗万象的术语。其历史上的一个里程碑是 2013 年谷歌和 NASA 启动的量子人工智能实验室,该实验室的任务是探索量子计算机如何用于机器学习。此后,“QML” 出现在研究论文、创业路演和会议演讲中——往往含义大相径庭。
| 解释 | 描述 |
|---|---|
| 量子加速的机器学习 | 使用量子硬件加速经典机器学习任务。 |
| 受量子启发的经典算法 | 借鉴量子物理思想的经典方法。 |
| 在量子硬件上进行机器学习 | 在陌生的(量子)硬件上运行熟悉的机器学习工作流。 |
即使是量子计算领域的研究者,我起初也感到困惑。一个常见的第一问题是:
究竟是什么让量子机器学习具有“量子”特性?
核心答案
简短的答案是 不是 速度、神经网络,或对“量子优势”的模糊引用。其核心在于,量子机器学习是由 信息的表示、转换和读取方式 定义的——使用 量子力学的规则 而非经典计算。
本系列的预期内容
本文旨在:
- 澄清 真正的量子方法与炒作之间的区别。
- 为本系列的其余部分提供清晰的概念基础。
- 探索 QML 的传说,以及 近期研究成果 和 应用。
敬请期待更深入的理论、算法和实践实验,了解量子机器学习不断演进的全景。
量子之前的机器学习
在我们全部转向量子之前,先退一步。剥离掉现代的包装,机器学习就是使用数据学习从输入到输出的映射。无论模型是线性回归、核方法,还是深度神经网络,结构或多或少都是相同的:
- 数据 以数值形式表示(向量、矩阵、张量)。
- 参数化模型 对这些数据进行转换。
- 通过优化代价函数来 调整参数。
- 模型 在新样本上进行统计评估。
神经网络、GPU 和海量数据集只是实现选择——并非定义特征。这种抽象很重要,因为它让我们能够提出一个精确的问题:
当 数据和模型存在于量子空间 时,会有什么变化?
Source: …
量子力学的介入
量子机器学习(QML)在量子信息成为计算基底时才称为“量子”。这体现在三种不同的方式上。
1. 数据以量子态表示
- 经典机器学习:数据 → 位或浮点数。
- QML:数据 → 量子态(复向量),用密度矩阵描述;变换为酉矩阵。
- 信息被编码在复振幅中,而不是经典概率。
- 量子态可以处于叠加状态。
注意: 这并不意味着每个经典数据集都会自动得到指数级压缩或轻易访问。将数据加载到量子态通常代价高昂,且信息的提取受到测量的根本限制。
关键点: 模型在量子态上操作,而不是在经典数值上。
2. 模型是量子演化
- 经典机器学习:对数据应用确定性函数。
- QML:对量子通道应用量子操作(通常是酉变换)。
在实际中,大多数 QML 模型由参数化量子电路构成——即一系列量子门,其参数在训练过程中被调节,类似于神经网络中权重的调整。
- 系统从一个由矩阵(常常是哈密顿量)描述的状态开始。
- 所施加的量子门决定系统随时间的演化方式,从而定义模型的行为。
因此,量子模型探索的假设空间在结构上与经典模型不同,即使训练循环表面上看起来相似。
3. 测量是学习过程的一部分
- 经典机器学习:读取模型输出是平凡的,不会影响模型本身。
- QML:测量是概率性的且破坏性的;它会使量子态坍缩。
- 输出通过重复执行电路得到,称为shots(多次运行同一电路以估计概率)。
- 梯度是从这些测量中统计估计的,而不是精确计算的,所以训练成本往往被采样噪声而非纯计算所主导。
结论: 不确定性内嵌于模型本身。任何对 QML 的严肃讨论都必须考虑学习是通过测量发生的,而不是在测量之后进行的。
什么 不 让 QML 成为量子
量子计算——尤其是量子机器学习(QML)——常常引发炒作和误解。许多带有“量子”标签的方法实际上在任何有意义的层面上都 不是量子 的。典型例子包括:
- 在量子硬件上运行的经典机器学习算法,但并未实质性地利用量子态。
- “量子灵感”方法,完全是经典的。
- 混合流水线,其中量子组件可以被移除而不影响模型的行为或性能。
快速测试
如果你遇到关于 QML 模型的声明,却不确定它到底有多量子化,可以问自己:
“我能否用经典部分替代量子部分,而不改变模型的数学结构吗?”
- 是(或“可能是”)→ 该方法可能并非根本上是量子的。
- 否 → 该方法可能利用了真正的量子特性。
即使是非量子的方法也可能有价值,只是它们不属于量子机器学习的核心范畴。
QML 现状如何?
在讨论量子计算时,请记住当前硬件是嘈杂的、规模小的、资源受限的。因此:
- 对于机器学习任务,今天没有通用的、经过验证的量子优势。
- 许多 QML 模型更像是核方法,而不是深度神经网络。
- 数据加载和噪声通常主导性能。
这并不是该领域的失败;它反映了量子计算的当前状态。大多数 QML 研究现在是探索性的:映射模型类别、理解量子学习理论,并确定量子结构可能提供优势的地方。
为什么量子机器学习仍然值得研究
如果短期内加速不太可能,为什么还要研究量子机器学习?
- 基础洞见 – 量子机器学习迫使我们重新思考机器学习和量子计算的基础性问题。
- 定义量子数据上的学习 – 我们必须回答从量子数据中学习到底意味着什么,噪声如何影响优化,以及哪些模型类别只存在于量子系统中而没有经典对应。
更广阔的视角
量子机器学习并非今天就要超越经典机器学习,而是关于 在量子世界中扩展“学习”可能的意义的空间。
- 科学进步 – 新方法常常引发突破;现在探索量子机器学习为未来硬件的进步做好准备。
- 面向未来 – 即使当前硬件尚未成熟,我们今天开发的概念、算法和理论也将在技术赶上时发挥作用。
最终思考与后续展望
量子计算的进展正在加速。硬件公司正争相构建容错量子计算机——一种能够充分利用量子力学全部潜能的机器。与此同时,软件和应用公司正在探索量子计算能够有意义地解决的问题。
话虽如此,现有的量子计算机仍无法运行接近实际规模的应用,更别说复杂的机器学习模型了。
然而,量子计算在机器学习中提升效率的前景令人着迷,值得在硬件进步的同时进行探索。
在本文中,我聚焦于量子机器学习的定义和边界,为后续探讨以下内容奠定基础:
- 如何将经典数据嵌入量子态。
- 变分量子模型及其局限性。
- 量子核函数与特征空间。
- 噪声量子系统中的优化挑战。
- 量子优势可能出现的领域。
在探讨量子机器学习是否有用之前,我们需要明确它到底是什么。我们越是远离炒作,就越能向真正的进步迈进。