[Paper] 얕은 회로 기반 지도 학습 on a Quantum Processor
Source: arXiv - 2601.03235v1
Overview
이 논문은 오늘날의 노이즈가 있는 양자 프로세서에서 실행되는 얕은 회로 기반 감독 학습 프레임워크를 제시한다. 고전 데이터를 작은 k‑국소 해밀토니안의 바닥 상태에 인코딩하고, 샘플 기반 크리볼 대각화 기법으로 이러한 해밀토니안을 훈련함으로써, 저자들은 IBM의 Heron 장치에서 50 큐비트까지 확장 가능한 실용적인 양자‑머신‑러닝 파이프라인을 시연한다. 이 연구는 데이터 로딩 비용과 barren‑plateau‑유발 학습 불가능성이라는 두 가지 오래된 장애물을 해결하여, 양자‑강화 학습을 근시일 내 응용에 현실적인 전망으로 만든다.
Key Contributions
- Compact data encoding: 선형‑Hamiltonian 표현을 도입하여 각 데이터 포인트를 k‑local Hamiltonian의 바닥 상태에 매핑함으로써 필요한 큐비트 수와 회로 깊이를 크게 줄인다.
- Sample‑based Krylov diagonalization: 얕은 회로와 제한된 측정 횟수만으로 데이터 Hamiltonian의 저에너지 고유 상태를 추정하기 위해 양자‑고전 하이브리드 알고리즘을 적용한다.
- Local‑gradient training: Hamiltonian 파라미터를 local gradient 정보만으로 최적화할 수 있음을 보여주어, 깊은 변분 회로에서 흔히 발생하는 barren‑plateau 문제를 회피한다.
- Scalable experimental validation: IBM의 27‑큐비트 및 50‑큐비트 Heron 프로세서에서 전체 파이프라인을 구현하고, Iris, MNIST‑binary 등 표준 벤치마크에서 경쟁력 있는 분류 정확도를 달성한다.
- Open‑source toolbox: Qiskit 기반의 Python 라이브러리를 공개하여 data‑to‑Hamiltonian 변환, Krylov 부분공간 구성, gradient‑based 훈련을 자동화한다.
Methodology
-
Data‑to‑Hamiltonian mapping
- 각 고전적인 특징 벡터 (x)는 k‑local 해밀토니안 (H(x;\theta))에 임베딩되며, 그 기본 상태 (|\psi_0(x)\rangle)가 데이터를 인코딩합니다.
- 매핑은 파라미터 (\theta)에 대해 선형이므로, 파울리 문자열들의 가중합으로 직관적으로 해석할 수 있습니다.
-
Krylov‑subspace diagonalization
- 간단한 기준 상태(예: 전부 0)에서 시작하여, 알고리즘은 샘플 기반 (\langle\phi_i|H|\phi_j\rangle) 평가를 이용해 Krylov 기저 ({|\phi_j\rangle = H^j |\phi_0\rangle})를 구축합니다.
- 작은 고전적 고유값 해석기가 최저 에너지 고유벡터의 근사값을 추출하며, 이는 모델의 예측으로 사용됩니다.
-
Training via local gradients
- 손실(예: 교차 엔트로피)은 몇 개의 파울리 연산자 기대값에만 의존하므로, 파라미터 시프트 규칙을 이용해 얕은 회로만으로 (\partial L / \partial \theta_k) 그라디언트를 추정할 수 있습니다.
- 해밀토니안이 (\theta)에 대해 선형이기 때문에, 그라디언트 지형이 매끄럽고 깊은 변분 안사츠에서 흔히 나타나는 지수적 소실 그라디언트를 피할 수 있습니다.
-
Hybrid workflow
- 양자 서브루틴(상태 준비, 파울리 문자열 측정)은 하드웨어에서 실행되고, 모든 선형 대수 후처리(Krylov 기저 구성, 고유값 풀이, 그라디언트 집계)는 고전 CPU에서 수행됩니다.
결과 및 발견
| 데이터셋 | 사용된 큐비트 | 테스트 정확도 | 고전적 기준* |
|---|---|---|---|
| Iris (3‑class) | 12 | 94 % | 96 % |
| MNIST‑binary (0 vs 1) | 30 | 98 % | 99 % |
| Synthetic 8‑dimensional | 50 | 92 % | 94 % |
- Depth: 모든 회로가 20개의 2‑큐비트 게이트 이하이며, IBM 초전도 큐비트의 코히런스 윈도우 내에 있습니다.
- Sample efficiency: 파울리 항당 ≤ 500개의 측정 샷으로 정확한 바닥 상태 추정치를 얻었으며, 이는 전 상태 토모그래피에 비해 크게 감소한 것입니다.
- Scalability: 실행 시간이 큐비트 수에 대해 대략 선형적으로 증가하며, 이 방법의 비용이 전체 시스템 크기가 아니라 k‑local 해밀토니안 크기에 의해 지배된다는 이론적 주장을 확인합니다.
*클래식 베이스라인은 동일한 데이터로 학습된 로지스틱 회귀 모델을 의미합니다.
Practical Implications
- Near‑term quantum advantage: 회로를 얕게 유지하고 데이터 로딩 비용을 낮게 함으로써, 이 접근법은 고전 자원이 제한된 엣지 디바이스(예: 양자 코프로세서를 갖춘 IoT 센서)에서 양자‑강화 추론을 실현 가능한 경로를 열어준다.
- Hybrid pipelines: 개발자는 제공된 Qiskit‑기반 라이브러리를 기존 ML 스택(PyTorch, TensorFlow)에 커스텀 레이어로 통합하여 가장 비용이 많이 드는 선형‑대수 단계를 양자 하드웨어에 오프로드할 수 있다.
- Feature engineering: 해밀토니안 형식은 자연스럽게 feature‑wise 로컬리티를 지원하여 도메인 특화 인코딩(예: 그래프 인접성을 2‑local 항으로 표현)을 회로 깊이 폭발 없이 가능하게 한다.
- Reduced training cost: 로컬 그라디언트 덕분에 확률적 경사 하강법을 깊은 변분 회로에 비해 훨씬 적은 양자 평가 횟수로 수행할 수 있어, 양자‑as‑a‑service 제공자의 클라우드‑컴퓨트 비용이 낮아진다.
제한 사항 및 향후 연구
- Hardware noise: 방법은 중간 정도의 디포라라이징 노이즈를 견디지만, 30 쿼비트 이상 실행 시 여전히 오류 완화가 필요합니다; 저자들은 보다 정교한 제로‑노이즈 외삽(zero‑noise extrapolation)이 충실도를 추가로 향상시킬 수 있다고 언급했습니다.
- Expressivity bound: 선형 해밀토니안은 매우 비선형적인 결정 경계에 대해 어려움을 겪을 수 있으며, 이차 혹은 고차 해밀토니안으로 프레임워크를 확장하는 것이 열린 연구 과제입니다.
- Dataset size: 실험은 데이터 포인트당 별도의 해밀토니안을 구성하는 비용 때문에 최대 10 k개의 학습 샘플로 제한되었습니다; 배치 처리나 파라미터를 공유하는 해밀토니안을 도입하면 이 병목을 완화할 수 있습니다.
- Benchmark diversity: 향후 작업에서는 CIFAR‑10, 시계열 데이터와 같은 더 크고 실제적인 데이터셋에 접근하고, 최신 양자 커널 및 고전적 딥넷과 비교 평가해야 합니다.
전반적으로 이 논문은 얕은 해밀토니안 기반 양자 모델이 현재 하드웨어에서 효율적으로 학습될 수 있음을 보여주며, 실무 환경에서 실용적인 양자 머신러닝으로 나아가기 위한 구체적인 디딤돌을 제공합니다.
저자
- Luca Candelori
- Swarnadeep Majumder
- Antonio Mezzacapo
- Javier Robledo Moreno
- Kharen Musaelian
- Santhanam Nagarajan
- Sunil Pinnamaneni
- Kunal Sharma
- Dario Villani
논문 정보
- arXiv ID: 2601.03235v1
- 분류: quant-ph, cs.LG, stat.ML
- 출판일: 2026년 1월 6일
- PDF: PDF 다운로드