[Paper] push0:可扩展且容错的零知识证明生成编排
发布: (2026年2月18日 GMT+8 18:22)
8 分钟阅读
原文: arXiv
Source: arXiv - 2602.16338v1
(请提供您希望翻译的正文内容,我将为您翻译成简体中文。)
概览
零知识(ZK)证明生成是现代区块链扩容方案(如 ZK‑rollups 和以太坊即将推出的 zkEVM)的性能瓶颈。论文 “push0: Scalable and Fault‑Tolerant Orchestration for Zero‑Knowledge Proof Generation” 介绍了一种云原生编排层,能够在多个 prover 实例之间调度证明生成任务,同时保证严格的区块顺序、子槽延迟以及对故障的自动恢复。作者展示了 push0 能将编排开销控制在几毫秒——相对于典型证明 7 秒以上的计算时间几乎不可见,从而使以太坊上的实时、无状态验证成为可能。
关键贡献
- Event‑driven dispatcher‑collector architecture 基于持久化优先队列,强制链头顺序,同时在区块内部利用并行性。
- Prover‑agnostic scheduling primitives 使运营商能够插入任何 zkVM 二进制文件,而无需重写编排逻辑。
- Fault‑tolerant task reassignment 通过持久化消息队列,实现节点崩溃或网络故障时的自动恢复。
- Production‑grade evaluation 在 Kubernetes 集群和实时 Zircuit Rollup(1400 万+ 区块)上进行,显示中位编排延迟低于 10 ms,并在最多 32 个调度器时实现近乎完美的扩展性。
- Formalization of real‑time proving requirements,源自以太坊 12 秒时隙窗口和 ZK‑rollup 最终性约束。
方法论
- 需求形式化 – 作者从生产 rollup 操作员和 Ethereum zkEVM 规范中提炼出四个硬约束:(i) 区块的严格顺序排列,(ii) 在子槽截止时间内完成证明,(iii) 对失败任务的弹性重新分配,(iv) 支持异构证明者。
- 系统设计 – push0 将 调度器(从优先队列中拉取区块级任务并交给可用的证明者)与 收集器(收集已完成的证明并确认队列)分离。两个组件都是运行在容器中的无状态服务,通过持久化消息中间件(例如 NATS JetStream 或 Kafka)进行通信。
- 调度逻辑 – 任务按区块高度排序;调度器仅在所有前置区块标记为完成后才释放证明任务,确保链头顺序。在同一区块内,调度器可以将多个子任务(例如证明不同的分片)并行分发,以利用区块内并行性。
- 容错机制 – 如果证明者容器崩溃或任务超时,消息将在队列中保持未确认状态,并自动重新入队供其他调度器处理。
- 评估 – 使用了两套实验环境:(a) 受控的 Docker 环境以隔离网络波动,(b) 生产规模的 Kubernetes 集群,模拟 Zircuit rollup 的工作负载。捕获的指标包括中位数编排延迟、扩展效率以及占总证明时间的开销百分比。
结果与发现
| 指标 | 受控 Docker | 生产 K8s (Zircuit) |
|---|---|---|
| 中位数编排延迟 (P50) | 3–10 ms | 5 ms |
| 在 32 个调度器下的扩展效率 | 99–100 % | 99–100 % |
| 相对于证明计算的开销(7 s) | < 0.1 % | < 0.1 % |
| 故障恢复延迟(重新调度) | ≤ 15 ms | ≤ 20 ms |
- 可忽略的开销: 即使在峰值负载下,编排也只占总证明生成时间的千分之一以下。
- 线性扩展: 增加调度器几乎实现了完美的线性加速,验证了基于队列的设计能够避免争用。
- 鲁棒性: 模拟的节点故障能够自动恢复,无需人工干预,整体区块最终性期限保持不变。
- 真实环境验证: 该系统已在 Zircuit 上处理超过 1400 万个主网区块,证明实验室结果能够在生产流量中得到体现。
实际影响
- 针对 Rollup 操作员: push0 提供即插即用的调度器,可直接嵌入现有的证明流水线,降低实现亚秒级最终性目标所需的工程工作量。
- 针对 zkEVM 部署: 通过将编排延迟控制在 10 ms 以下,系统轻松适配以太坊 12 秒的 slot,支持无状态验证,并有可能降低证明验证的 gas 成本。
- 多证明者生态系统: 证明者无关的 API 使运营商能够在不重写编排代码的情况下尝试更新、更快的 zkVM(例如基于 PLONK、Halo2),促进更具竞争力的证明者市场。
- 云原生部署: 由于 push0 以容器化微服务形式运行在 Kubernetes 上,可利用现代云栈已有的自动伸缩、可观测性和安全特性。
- 成本节约: 编排开销几乎为零,计算资源全部用于证明生成,提高硬件利用率,降低运营支出。
限制与未来工作
- 网络受限场景: 研究假设集群内部网络相对稳定;极端的延迟或丢包可能影响队列一致性和任务重新分配的延迟。
- 证明者异构开销: 虽然 API 对证明者保持中立,但论文并未量化混合使用运行时特性差异巨大的证明者对整体吞吐量的影响。
- 安全审计: 编排层本身成为关键组件;正式的安全分析和加固实现留待未来工作。
- 去中心化治理: 将 push0 扩展至支持真正的去中心化多证明者网络(例如链上激励机制)是一个开放的研究方向。
作者
- Mohsen Ahmadvand
- Rok Pajnič
- Ching-Lun Chiu
论文信息
- arXiv ID: 2602.16338v1
- 分类: cs.DC, cs.CR
- 出版时间: 2026年2月18日
- PDF: Download PDF