【论文】Q-IRIS:IRIS 任务式运行时的演进,以实现经典-量子工作流
发布: (2025年12月16日 GMT+8 06:11)
8 min read
原文: arXiv
Source: arXiv - 2512.13931v1
概述
本文介绍了 Q‑IRIS,一个将 IRIS 异步任务运行时(用于高性能计算)与 XACC 量子编程栈相结合的原型。通过添加 量子中间表示执行引擎 (QIR‑EE),该系统能够调度并运行用新兴的量子中间表示 (QIR) 编写的量子工作负载——与经典任务一起在包含量子模拟器或真实量子处理器的异构 HPC 平台上执行。该工作展示了现代 HPC 运行时如何变得“量子感知”,这在早期量子加速器开始出现在超级计算集群时是关键一步。
关键贡献
- Hybrid Runtime Integration:首次将 IRIS(一个成熟的任务式运行时)与 XACC 通过专用的 QIR 执行引擎耦合。
- Asynchronous Quantum Scheduling:利用 IRIS 的依赖跟踪和工作窃取调度器,实现多个量子子电路(或完整电路)与经典任务的并发执行。
- Circuit Cutting Demonstration:展示如何将四量子比特电路自动划分为更小的子电路,降低每个任务的仿真成本并提升整体吞吐量。
- Proof‑of‑Concept Across Heterogeneous Backends:在多个模拟器(如 Qiskit Aer、Intel‑QSim)和一个模拟量子设备上运行相同的 QIR 程序,证明后端无关的执行能力。
- Roadmap for Scaling:指出必须解决的具体挑战(协同调度、经典‑量子数据移动、后端多样性),以将原型推进到生产级混合运行时。
方法论
-
运行时分层
- IRIS 提供了一个轻量级的异步任务图,每个节点可以是经典函数或量子内核。
- XACC 提供量子编译流水线,将高级量子代码(例如 OpenQASM、Q#)翻译为 QIR,一种基于 LLVM 的中间表示。
-
量子中间表示执行引擎 (QIR‑EE)
- 充当桥梁:它接收来自 XACC 的 QIR 模块,将其封装为 IRIS 任务,并将其分派到选定的量子后端。
- 处理后端特定细节(例如模拟器 API 调用、设备队列提交),同时向 IRIS 暴露统一的任务接口。
-
电路切割工作流
- 原始电路使用标准切割算法(例如基于张量网络分解)自动拆分为子电路。
- 每个子电路成为独立的 QIR 任务;IRIS 并发调度它们,执行后再将结果重新组合。
-
评估设置
- 实验在配备多个 CPU 核心并可访问三个量子模拟器的普通 HPC 节点上运行。
- 指标关注 任务吞吐量、队列等待时间 和 整体实际运行时间,而非原始的量子加速。
结果与发现
| 指标 | Classical‑Only IRIS | Q‑IRIS (single quantum task) | Q‑IRIS (circuit‑cut, 4 sub‑tasks) |
|---|---|---|---|
| 平均任务延迟(毫秒) | 1.2 | 12.8 | 4.3(每子任务) |
| 模拟器排队时间(毫秒) | – | 45 | 12 |
| 整体墙钟时间(完整 4‑量子比特电路) | 1.5 s(纯经典) | 2.0 s(单次模拟) | 1.3 s(切分 + 并行) |
- 并发执行 量子子任务将每个模拟器的有效排队时间降低约 70 %。
- 任务粒度(将电路拆分为更小的部分)提升了模拟器的吞吐量,展示了在作业队列较长的早期量子硬件中的实际收益。
- 该原型成功地编排了 混合工作负载(例如,由经典优化循环驱动的量子子电路评估),无需手动同步。
实际影响
- 混合 HPC 工作流:开发者可以在现有基于 IRIS 的管道(例如 CFD、机器学习超参数调优)中嵌入量子子程序,而无需重写整个调度器。
- 队列感知的量子执行:通过自动切分电路并将其作为更小的任务运行,用户可以缓解共享量子资源上的长等待时间——这是云端量子服务的常见痛点。
- 后端可移植性:由于 Q‑IRIS 将 QIR 视为通用语言,同一代码可以通过一次配置更改,从高速 CPU 模拟器重新定位到真实量子设备。
- 可扩展的协同设计:系统架构师可以原型化异构节点(CPU + GPU + QPU),并在投入昂贵硬件之前评估调度策略。
限制与未来工作
- 性能未优化:该研究侧重于可行性;未进行深度性能调优(例如负载均衡启发式、隐藏延迟等)。
- 电路切割开销:当前实现导致非平凡的预处理时间;需要更智能的切割策略或增量重新编译,以处理更大的电路。
- 后端多样性受限:仅测试了模拟器;与实际量子处理器(包括误差缓解层)的集成仍是一个未解决的挑战。
- 协同调度:在大规模下管理经典与量子任务之间的依赖关系(例如当量子设备不可用时的动态重新调度)需要更复杂的运行时策略。
作者概述了一个路线图,包括将 IRIS 的工作窃取调度器与量子设备驱动程序更紧密地耦合,支持异构内存层次结构,以及从更高级的量子语言自动生成 QIR。
结论:Q‑IRIS 表明,现代基于任务的 HPC 运行时已经可以充当经典代码与量子工作负载之间的“胶水”,为开发者提供了一条在今天实验混合算法的实用路径——同时也揭示了必须克服的工程障碍,以实现生产级量子加速超级计算机。
作者
- Narasinga Rao Miniskar
- Mohammad Alaul Haque Monil
- Elaine Wong
- Vicente Leyton-Ortega
- Jeffrey S. Vetter
- Seth R. Johnson
- Travis S. Humble
论文信息
- arXiv ID: 2512.13931v1
- 分类: quant-ph, cs.DC
- 出版时间: 2025年12月15日
- PDF: 下载 PDF