【论文】Q-IRIS:IRIS 任务式运行时的演进,以实现经典-量子工作流

发布: (2025年12月16日 GMT+8 06:11)
8 min read
原文: arXiv

Source: arXiv - 2512.13931v1

概述

本文介绍了 Q‑IRIS,一个将 IRIS 异步任务运行时(用于高性能计算)与 XACC 量子编程栈相结合的原型。通过添加 量子中间表示执行引擎 (QIR‑EE),该系统能够调度并运行用新兴的量子中间表示 (QIR) 编写的量子工作负载——与经典任务一起在包含量子模拟器或真实量子处理器的异构 HPC 平台上执行。该工作展示了现代 HPC 运行时如何变得“量子感知”,这在早期量子加速器开始出现在超级计算集群时是关键一步。

关键贡献

  • Hybrid Runtime Integration:首次将 IRIS(一个成熟的任务式运行时)与 XACC 通过专用的 QIR 执行引擎耦合。
  • Asynchronous Quantum Scheduling:利用 IRIS 的依赖跟踪和工作窃取调度器,实现多个量子子电路(或完整电路)与经典任务的并发执行。
  • Circuit Cutting Demonstration:展示如何将四量子比特电路自动划分为更小的子电路,降低每个任务的仿真成本并提升整体吞吐量。
  • Proof‑of‑Concept Across Heterogeneous Backends:在多个模拟器(如 Qiskit Aer、Intel‑QSim)和一个模拟量子设备上运行相同的 QIR 程序,证明后端无关的执行能力。
  • Roadmap for Scaling:指出必须解决的具体挑战(协同调度、经典‑量子数据移动、后端多样性),以将原型推进到生产级混合运行时。

方法论

  1. 运行时分层

    • IRIS 提供了一个轻量级的异步任务图,每个节点可以是经典函数或量子内核。
    • XACC 提供量子编译流水线,将高级量子代码(例如 OpenQASM、Q#)翻译为 QIR,一种基于 LLVM 的中间表示。
  2. 量子中间表示执行引擎 (QIR‑EE)

    • 充当桥梁:它接收来自 XACC 的 QIR 模块,将其封装为 IRIS 任务,并将其分派到选定的量子后端。
    • 处理后端特定细节(例如模拟器 API 调用、设备队列提交),同时向 IRIS 暴露统一的任务接口。
  3. 电路切割工作流

    • 原始电路使用标准切割算法(例如基于张量网络分解)自动拆分为子电路。
    • 每个子电路成为独立的 QIR 任务;IRIS 并发调度它们,执行后再将结果重新组合。
  4. 评估设置

    • 实验在配备多个 CPU 核心并可访问三个量子模拟器的普通 HPC 节点上运行。
    • 指标关注 任务吞吐量队列等待时间整体实际运行时间,而非原始的量子加速。

结果与发现

指标Classical‑Only IRISQ‑IRIS (single quantum task)Q‑IRIS (circuit‑cut, 4 sub‑tasks)
平均任务延迟(毫秒)1.212.84.3(每子任务)
模拟器排队时间(毫秒)4512
整体墙钟时间(完整 4‑量子比特电路)1.5 s(纯经典)2.0 s(单次模拟)1.3 s(切分 + 并行)
  • 并发执行 量子子任务将每个模拟器的有效排队时间降低约 70 %。
  • 任务粒度(将电路拆分为更小的部分)提升了模拟器的吞吐量,展示了在作业队列较长的早期量子硬件中的实际收益。
  • 该原型成功地编排了 混合工作负载(例如,由经典优化循环驱动的量子子电路评估),无需手动同步。

实际影响

  • 混合 HPC 工作流:开发者可以在现有基于 IRIS 的管道(例如 CFD、机器学习超参数调优)中嵌入量子子程序,而无需重写整个调度器。
  • 队列感知的量子执行:通过自动切分电路并将其作为更小的任务运行,用户可以缓解共享量子资源上的长等待时间——这是云端量子服务的常见痛点。
  • 后端可移植性:由于 Q‑IRIS 将 QIR 视为通用语言,同一代码可以通过一次配置更改,从高速 CPU 模拟器重新定位到真实量子设备。
  • 可扩展的协同设计:系统架构师可以原型化异构节点(CPU + GPU + QPU),并在投入昂贵硬件之前评估调度策略。

限制与未来工作

  • 性能未优化:该研究侧重于可行性;未进行深度性能调优(例如负载均衡启发式、隐藏延迟等)。
  • 电路切割开销:当前实现导致非平凡的预处理时间;需要更智能的切割策略或增量重新编译,以处理更大的电路。
  • 后端多样性受限:仅测试了模拟器;与实际量子处理器(包括误差缓解层)的集成仍是一个未解决的挑战。
  • 协同调度:在大规模下管理经典与量子任务之间的依赖关系(例如当量子设备不可用时的动态重新调度)需要更复杂的运行时策略。

作者概述了一个路线图,包括将 IRIS 的工作窃取调度器与量子设备驱动程序更紧密地耦合,支持异构内存层次结构,以及从更高级的量子语言自动生成 QIR。

结论:Q‑IRIS 表明,现代基于任务的 HPC 运行时已经可以充当经典代码与量子工作负载之间的“胶水”,为开发者提供了一条在今天实验混合算法的实用路径——同时也揭示了必须克服的工程障碍,以实现生产级量子加速超级计算机。

作者

  • Narasinga Rao Miniskar
  • Mohammad Alaul Haque Monil
  • Elaine Wong
  • Vicente Leyton-Ortega
  • Jeffrey S. Vetter
  • Seth R. Johnson
  • Travis S. Humble

论文信息

  • arXiv ID: 2512.13931v1
  • 分类: quant-ph, cs.DC
  • 出版时间: 2025年12月15日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »