[Paper] Q-IRIS: 고전‑양자 워크플로우를 가능하게 하는 IRIS 태스크 기반 런타임의 진화
Source: arXiv - 2512.13931v1
개요
이 논문은 Q‑IRIS라는 프로토타입을 소개합니다. 이 프로토타입은 고성능 컴퓨팅에서 사용되는 IRIS 비동기 작업 기반 런타임을 XACC 양자 프로그래밍 스택과 결합합니다. Quantum Intermediate Representation Execution Engine (QIR‑EE) 를 추가함으로써, 시스템은 새로운 Quantum Intermediate Representation (QIR) 로 작성된 양자 워크로드를 고전 작업과 함께 이기종 HPC 플랫폼(양자 시뮬레이터 또는 실제 양자 프로세서를 포함)에서 스케줄링하고 실행할 수 있습니다. 이 작업은 현대 HPC 런타임이 “양자 인식”이 되는 방식을 보여주며, 초기 양자 가속기가 슈퍼컴퓨팅 클러스터에 등장하기 시작함에 따라 중요한 단계가 됩니다.
주요 기여
- Hybrid Runtime Integration: 검증된 태스크 기반 런타임인 IRIS와 XACC를 전용 QIR 실행 엔진을 통해 최초로 결합.
- Asynchronous Quantum Scheduling: IRIS의 의존성 추적 및 워크‑스틸링 스케줄러를 활용해 여러 양자 서브‑회로(또는 전체 회로)를 클래식 태스크와 동시에 실행 가능하게 함.
- Circuit Cutting Demonstration: 4‑큐빗 회로를 자동으로 더 작은 서브‑회로로 분할하여 태스크당 시뮬레이션 비용을 감소시키고 전체 처리량을 향상시킴을 보여줌.
- Proof‑of‑Concept Across Heterogeneous Backends: 동일한 QIR 프로그램을 여러 시뮬레이터(예: Qiskit Aer, Intel‑QSim)와 모의 양자 디바이스에서 실행하여 백엔드에 구애받지 않는 실행을 입증.
- Roadmap for Scaling: 프로토타입에서 프로덕션 급 하이브리드 런타임으로 전환하기 위해 해결해야 할 구체적인 과제(조정된 스케줄링, 클래식‑양자 데이터 이동, 백엔드 다양성)를 식별.
Methodology
-
Runtime Layering
- IRIS는 각 노드가 고전 함수이거나 양자 커널이 될 수 있는 가벼운 비동기 작업 그래프를 제공합니다.
- XACC는 양자 컴파일 파이프라인을 제공하여 고수준 양자 코드(예: OpenQASM, Q#)를 QIR(LLVM 기반 중간 표현)로 변환합니다.
-
Quantum Intermediate Representation Execution Engine (QIR‑EE)
- 다리 역할을 수행합니다: XACC로부터 QIR 모듈을 받아 IRIS 작업으로 패키징하고 선택된 양자 백엔드에 전달합니다.
- 백엔드별 세부 사항(예: 시뮬레이터 API 호출, 디바이스 큐 제출)을 처리하면서 IRIS에 일관된 작업 인터페이스를 제공합니다.
-
Circuit Cutting Workflow
- 원래 회로는 표준 절단 알고리즘(예: 텐서 네트워크 분해 기반)을 사용해 자동으로 서브 회로로 분할됩니다.
- 각 서브 회로는 독립적인 QIR 작업이 되며, IRIS가 이를 동시에 스케줄링하고 실행 후 결과를 재조합합니다.
-
Evaluation Setup
- 실험은 여러 CPU 코어를 갖춘 소규모 HPC 노드와 세 개의 양자 시뮬레이터에 대한 접근성을 이용해 수행됩니다.
- 측정 지표는 작업 처리량, 큐 대기 시간, **전체 실시간(벽시계 시간)**에 초점을 맞추며, 순수한 양자 속도 향상은 고려하지 않습니다.
결과 및 발견
| 지표 | 클래식 전용 IRIS | Q‑IRIS (단일 양자 작업) | Q‑IRIS (회로 절단, 4 하위 작업) |
|---|---|---|---|
| 평균 작업 지연 시간 (ms) | 1.2 | 12.8 | 4.3 (하위 작업당) |
| 시뮬레이터 대기 시간 (ms) | – | 45 | 12 |
| 전체 실시간 (전체 4‑큐비트 회로) | 1.5 s (순수 클래식) | 2.0 s (단일 시뮬레이션) | 1.3 s (절단 + 병렬) |
- 양자 하위 작업들의 동시 실행으로 각 시뮬레이터의 실제 대기 시간이 약 70 % 감소했습니다.
- 작업 세분화(회로를 더 작은 조각으로 나누는 것)로 시뮬레이터 처리량이 향상되어, 작업 대기열이 긴 초기 단계 양자 하드웨어에 실용적인 이점을 보여줍니다.
- 프로토타입은 혼합 워크로드(예: 클래식 최적화 루프가 양자 하위 회로 평가를 구동하는)를 수동 동기화 없이 성공적으로 조정했습니다.
Practical Implications
- Hybrid HPC Workflows: 개발자는 전체 스케줄러를 다시 작성하지 않고도 기존 IRIS 기반 파이프라인(예: CFD, ML 하이퍼파라미터 튜닝) 안에 양자 서브루틴을 삽입할 수 있다.
- Queue‑Aware Quantum Execution: 회로를 자동으로 분할하여 작은 작업으로 실행함으로써, 사용자는 공유 양자 자원의 긴 대기 시간을 완화할 수 있다—클라우드 기반 양자 서비스에서 흔히 겪는 문제점이다.
- Backend Portability: Q‑IRIS가 QIR을 공통 언어로 다루기 때문에, 동일한 코드를 빠른 CPU 시뮬레이터에서 실제 양자 장치로 단일 설정 변경만으로 재타깃팅할 수 있다.
- Scalable Co‑Design: 시스템 설계자는 이기종 노드(CPU + GPU + QPU)를 프로토타이핑하고, 비싼 하드웨어에 투자하기 전에 스케줄링 정책을 평가할 수 있다.
Limitations & Future Work
- Performance Not Optimized: 연구는 실현 가능성에 초점을 맞추었으며, 로드‑밸런싱 휴리스틱, 지연 숨기기 등과 같은 깊은 성능 튜닝은 수행되지 않았습니다.
- Circuit Cutting Overhead: 현재 구현은 상당한 전처리 시간을 요구합니다; 더 큰 회로를 위해서는 보다 스마트한 절단 전략이나 증분 재컴파일이 필요합니다.
- Limited Backend Diversity: 시뮬레이터만 테스트했으며, 실제 양자 프로세서와의 통합(오류 완화 계층 포함)은 아직 해결되지 않은 과제입니다.
- Coordinated Scheduling: 대규모에서 고전적 작업과 양자 작업 간 의존성을 관리하는 것(예: 양자 장치가 사용 불가능해질 때 동적 재스케줄링)은 보다 정교한 런타임 정책이 필요합니다.
저자들은 IRIS의 워크‑스틸링 스케줄러와 양자 장치 드라이버 간의 긴밀한 결합, 이기종 메모리 계층 지원, 고수준 양자 언어에서 자동 QIR 생성 등을 포함하는 로드맵을 제시합니다.
Bottom line: Q‑IRIS는 현대적인 태스크 기반 HPC 런타임이 이미 고전 코드와 양자 워크로드 사이의 “접착제” 역할을 할 수 있음을 보여주며, 개발자들에게 오늘날 하이브리드 알고리즘을 실험할 실용적인 경로를 제공하는 동시에, 생산 등급 양자 가속 슈퍼컴퓨터를 위해 해결해야 할 엔지니어링 장벽들을 드러냅니다.
저자
- Narasinga Rao Miniskar
- Mohammad Alaul Haque Monil
- Elaine Wong
- Vicente Leyton-Ortega
- Jeffrey S. Vetter
- Seth R. Johnson
- Travis S. Humble
논문 정보
- arXiv ID: 2512.13931v1
- 분류: quant-ph, cs.DC
- 출판일: 2025년 12월 15일
- PDF: Download PDF