[Paper] Q-IRIS: 고전‑양자 워크플로우를 가능하게 하는 IRIS 태스크 기반 런타임의 진화

발행: (2025년 12월 16일 오전 07:11 GMT+9)
10 min read
원문: arXiv

Source: arXiv - 2512.13931v1

개요

이 논문은 Q‑IRIS라는 프로토타입을 소개합니다. 이 프로토타입은 고성능 컴퓨팅에서 사용되는 IRIS 비동기 작업 기반 런타임을 XACC 양자 프로그래밍 스택과 결합합니다. Quantum Intermediate Representation Execution Engine (QIR‑EE) 를 추가함으로써, 시스템은 새로운 Quantum Intermediate Representation (QIR) 로 작성된 양자 워크로드를 고전 작업과 함께 이기종 HPC 플랫폼(양자 시뮬레이터 또는 실제 양자 프로세서를 포함)에서 스케줄링하고 실행할 수 있습니다. 이 작업은 현대 HPC 런타임이 “양자 인식”이 되는 방식을 보여주며, 초기 양자 가속기가 슈퍼컴퓨팅 클러스터에 등장하기 시작함에 따라 중요한 단계가 됩니다.

주요 기여

  • Hybrid Runtime Integration: 검증된 태스크 기반 런타임인 IRIS와 XACC를 전용 QIR 실행 엔진을 통해 최초로 결합.
  • Asynchronous Quantum Scheduling: IRIS의 의존성 추적 및 워크‑스틸링 스케줄러를 활용해 여러 양자 서브‑회로(또는 전체 회로)를 클래식 태스크와 동시에 실행 가능하게 함.
  • Circuit Cutting Demonstration: 4‑큐빗 회로를 자동으로 더 작은 서브‑회로로 분할하여 태스크당 시뮬레이션 비용을 감소시키고 전체 처리량을 향상시킴을 보여줌.
  • Proof‑of‑Concept Across Heterogeneous Backends: 동일한 QIR 프로그램을 여러 시뮬레이터(예: Qiskit Aer, Intel‑QSim)와 모의 양자 디바이스에서 실행하여 백엔드에 구애받지 않는 실행을 입증.
  • Roadmap for Scaling: 프로토타입에서 프로덕션 급 하이브리드 런타임으로 전환하기 위해 해결해야 할 구체적인 과제(조정된 스케줄링, 클래식‑양자 데이터 이동, 백엔드 다양성)를 식별.

Methodology

  1. Runtime Layering

    • IRIS는 각 노드가 고전 함수이거나 양자 커널이 될 수 있는 가벼운 비동기 작업 그래프를 제공합니다.
    • XACC는 양자 컴파일 파이프라인을 제공하여 고수준 양자 코드(예: OpenQASM, Q#)를 QIR(LLVM 기반 중간 표현)로 변환합니다.
  2. Quantum Intermediate Representation Execution Engine (QIR‑EE)

    • 다리 역할을 수행합니다: XACC로부터 QIR 모듈을 받아 IRIS 작업으로 패키징하고 선택된 양자 백엔드에 전달합니다.
    • 백엔드별 세부 사항(예: 시뮬레이터 API 호출, 디바이스 큐 제출)을 처리하면서 IRIS에 일관된 작업 인터페이스를 제공합니다.
  3. Circuit Cutting Workflow

    • 원래 회로는 표준 절단 알고리즘(예: 텐서 네트워크 분해 기반)을 사용해 자동으로 서브 회로로 분할됩니다.
    • 각 서브 회로는 독립적인 QIR 작업이 되며, IRIS가 이를 동시에 스케줄링하고 실행 후 결과를 재조합합니다.
  4. Evaluation Setup

    • 실험은 여러 CPU 코어를 갖춘 소규모 HPC 노드와 세 개의 양자 시뮬레이터에 대한 접근성을 이용해 수행됩니다.
    • 측정 지표는 작업 처리량, 큐 대기 시간, **전체 실시간(벽시계 시간)**에 초점을 맞추며, 순수한 양자 속도 향상은 고려하지 않습니다.

결과 및 발견

지표클래식 전용 IRISQ‑IRIS (단일 양자 작업)Q‑IRIS (회로 절단, 4 하위 작업)
평균 작업 지연 시간 (ms)1.212.84.3 (하위 작업당)
시뮬레이터 대기 시간 (ms)4512
전체 실시간 (전체 4‑큐비트 회로)1.5 s (순수 클래식)2.0 s (단일 시뮬레이션)1.3 s (절단 + 병렬)
  • 양자 하위 작업들의 동시 실행으로 각 시뮬레이터의 실제 대기 시간이 약 70 % 감소했습니다.
  • 작업 세분화(회로를 더 작은 조각으로 나누는 것)로 시뮬레이터 처리량이 향상되어, 작업 대기열이 긴 초기 단계 양자 하드웨어에 실용적인 이점을 보여줍니다.
  • 프로토타입은 혼합 워크로드(예: 클래식 최적화 루프가 양자 하위 회로 평가를 구동하는)를 수동 동기화 없이 성공적으로 조정했습니다.

Practical Implications

  • Hybrid HPC Workflows: 개발자는 전체 스케줄러를 다시 작성하지 않고도 기존 IRIS 기반 파이프라인(예: CFD, ML 하이퍼파라미터 튜닝) 안에 양자 서브루틴을 삽입할 수 있다.
  • Queue‑Aware Quantum Execution: 회로를 자동으로 분할하여 작은 작업으로 실행함으로써, 사용자는 공유 양자 자원의 긴 대기 시간을 완화할 수 있다—클라우드 기반 양자 서비스에서 흔히 겪는 문제점이다.
  • Backend Portability: Q‑IRIS가 QIR을 공통 언어로 다루기 때문에, 동일한 코드를 빠른 CPU 시뮬레이터에서 실제 양자 장치로 단일 설정 변경만으로 재타깃팅할 수 있다.
  • Scalable Co‑Design: 시스템 설계자는 이기종 노드(CPU + GPU + QPU)를 프로토타이핑하고, 비싼 하드웨어에 투자하기 전에 스케줄링 정책을 평가할 수 있다.

Limitations & Future Work

  • Performance Not Optimized: 연구는 실현 가능성에 초점을 맞추었으며, 로드‑밸런싱 휴리스틱, 지연 숨기기 등과 같은 깊은 성능 튜닝은 수행되지 않았습니다.
  • Circuit Cutting Overhead: 현재 구현은 상당한 전처리 시간을 요구합니다; 더 큰 회로를 위해서는 보다 스마트한 절단 전략이나 증분 재컴파일이 필요합니다.
  • Limited Backend Diversity: 시뮬레이터만 테스트했으며, 실제 양자 프로세서와의 통합(오류 완화 계층 포함)은 아직 해결되지 않은 과제입니다.
  • Coordinated Scheduling: 대규모에서 고전적 작업과 양자 작업 간 의존성을 관리하는 것(예: 양자 장치가 사용 불가능해질 때 동적 재스케줄링)은 보다 정교한 런타임 정책이 필요합니다.

저자들은 IRIS의 워크‑스틸링 스케줄러와 양자 장치 드라이버 간의 긴밀한 결합, 이기종 메모리 계층 지원, 고수준 양자 언어에서 자동 QIR 생성 등을 포함하는 로드맵을 제시합니다.

Bottom line: Q‑IRIS는 현대적인 태스크 기반 HPC 런타임이 이미 고전 코드와 양자 워크로드 사이의 “접착제” 역할을 할 수 있음을 보여주며, 개발자들에게 오늘날 하이브리드 알고리즘을 실험할 실용적인 경로를 제공하는 동시에, 생산 등급 양자 가속 슈퍼컴퓨터를 위해 해결해야 할 엔지니어링 장벽들을 드러냅니다.

저자

  • Narasinga Rao Miniskar
  • Mohammad Alaul Haque Monil
  • Elaine Wong
  • Vicente Leyton-Ortega
  • Jeffrey S. Vetter
  • Seth R. Johnson
  • Travis S. Humble

논문 정보

  • arXiv ID: 2512.13931v1
  • 분류: quant-ph, cs.DC
  • 출판일: 2025년 12월 15일
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »

[Paper] LeaseGuard: Raft 리스 제대로 구현

Raft는 분산 데이터베이스에서 쓰기 복제를 위한 선도적인 합의 알고리즘입니다. 그러나 분산 데이터베이스는 일관된 읽기도 필요합니다. 이를 보장하기 위해…