[Paper] 重新审视用于低延迟 BFT 复制的投机式无领袖协议

发布: (2026年1月7日 GMT+8 03:56)
8 min read
原文: arXiv

Source: arXiv - 2601.03390v1

(请提供您希望翻译的正文内容。)

Overview

一篇新论文重新审视了“speculative leaderless”拜占庭容错 (BFT) 复制,并引入 Aspen,该协议在保持无领袖快速路径的超低延迟的同时,消除了以往设计受限的脆弱“no‑contention”要求。通过将最佳努力、时钟驱动的排序层与经典的 PBFT 回退相结合,Aspen 在跨广域部署的情况下仍能实现低于 75 ms 的提交时间,使 BFT 更适用于对延迟敏感的服务,如支付和实时分析。

关键贡献

  • 近乎最优的延迟:在不假设无争用工作负载的前提下,实现了 (2Δ + \varepsilon)(两个网络延迟加上极小的等待窗口)的提交延迟。
  • 最佳努力排序层:利用松散同步的时钟和网络延迟估计对并发客户端请求进行排序,能够容忍多达 (p) 台副本暂时出现分歧。
  • 混合安全保证:在部分同步模型下,通过在乐观条件失效时回退到 PBFT 风格的慢路径,确保安全性和活性。
  • 改进的容错性:仅需 (n = 3f + 2p + 1) 台副本即可容忍 (f) 个拜占庭故障,其中额外的 (2p) 台节点为快速路径提供对网络抖动的弹性。
  • 实证验证:在地理分布的测试平台上,Aspen 的提交时间小于 75 ms,吞吐量约为 19 k ops/s,比最先进的无领袖 BFT 协议提升了 1.2‑3.3 倍。

方法论

  1. 系统模型 – 作者假设一个许可制环境,包含 (n) 个副本,最多 (f) 个拜占庭(故障),以及一个部分同步网络(在未知的全局稳定时间之后,延迟有界为 (Δ))。
  2. 快速路径设计
    • 客户端到副本的广播:客户端向所有副本多播请求,绕过指定的领袖节点。
    • 基于时钟的排序:每个副本使用松散同步的时钟(例如 NTP/Chrony)并结合本地估计的网络延迟上界,对收到的请求进行时间戳标记。
    • 冲突检测:副本本地计算一个暂定的全序;如果两个副本对同一组请求提出不同的顺序,则分歧最多限制在 (p) 个副本。
    • 提交规则:一旦有 (2f + p + 1) 个副本回响相同的带时间戳的顺序,请求即被提交,确保至少有 (f+1) 个正确副本达成一致。
  3. 回退路径
    • 当无法组建快速路径法定人数(例如因争用过高或时钟漂移),副本会调用经典的 PBFT 三阶段提交(pre‑prepare、prepare、commit)以保持安全性。
  4. 评估
    • 作者在跨多个大洲的云虚拟机集群上部署了 Aspen,测量了端到端延迟、吞吐量以及在不同争用水平和故障注入下的恢复成本。

结果与发现

指标Aspen(快速路径)PBFT 回退之前的无领袖协议
提交延迟(中位数)≈ 70 ms (2Δ + ε)≈ 180 ms80‑250 ms(取决于争用程度)
吞吐量≈ 19 k req/s≈ 12 k req/s8‑15 k req/s
在 10% 争用下的延迟< 75 ms—(快速路径仍然可用)> 120 ms(快速路径停滞)
容错能力 (f = 1, p = 1)n = 6 副本n = 4 副本(PBFT)n = 4 副本(无额外 p)
  • 快速路径在中等争用下仍能存活:即使有 20 % 的请求冲突,基于时钟的排序仍能让系统保持在快速路径上。
  • 平滑降级:如果超过 (p) 个副本出现分歧,协议会自动切换到 PBFT,而不会违反安全性。
  • 网络延迟容忍度:额外的 (2p) 副本能够吸收暂时的延迟峰值,防止不必要的回退。

实际影响

  • 支付与金融科技服务:低于 75 ms 的最终确定性满足面向用户的交易系统的延迟期望,使基于 BFT 的账本能够在不牺牲速度的情况下取代传统的集中式数据库。
  • 边缘与多区域部署:松散同步时钟的方法可与现有的时间同步服务配合使用,运营商因此能够在数据中心之间运行 Aspen,而无需昂贵的硬件时钟。
  • 简化运维:通过消除对稳定领袖的需求,该协议降低了在许可区块链中进行领袖选举、故障转移和负载均衡的运维负担。
  • 可扩展的容错性:增加少量“额外”副本((2p) 项)即可在延迟稳定性上获得显著收益,这种权衡对能够快速启动低成本虚拟机的云原生服务具有吸引力。
  • 混合安全模型:开发者可以在常见情况下依赖快速路径,同时仍保有成熟的 PBFT 回退作为安全网,从而简化与共识层交互代码的正确性推理。

限制与未来工作

  • 时钟同步假设: Aspen 的快速路径依赖于有界的时钟漂移;极端的 NTP 攻击或高度不对称的网络条件可能导致频繁回退。
  • 额外副本成本: 需要 (2p) 个额外节点会提升基准副本数量,对小型联盟来说可能并非微不足道。
  • 争用阈值: 虽然协议能够容忍中等程度的争用,但极高的写‑写冲突率仍会使性能退化到 PBFT 路径。
  • 未来方向(作者提出)包括:
    1. 探索硬件辅助的时间源(例如 PTP)以收紧 (ε);
    2. 基于观测到的网络抖动自适应选择 (p);以及
    3. 融入密码学批处理技术以进一步提升吞吐量。

作者

  • Daniel Qian
  • Xiyu Hao
  • Jinkun Geng
  • Yuncheng Yao
  • Aurojit Panda
  • Jinyang Li
  • Anirudh Sivaraman

Paper Information

  • arXiv ID: 2601.03390v1
  • Categories: cs.DC
  • Published: 2026年1月6日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »

[Paper] 软件定义的 Agentic 服务

随着 multi-agent LLM pipelines 的复杂性增加,现有的 serving paradigms 无法适应动态的 serving conditions。我们认为,agentic serving system …