[Paper] KUBEDIRECT:释放集群管理器的全部潜能用于无服务器计算
Source: arXiv - 2601.19160v1
概览
FaaS 平台依赖像 Kubernetes 这样的集群管理器进行资源管理。Kubernetes 因其以状态为中心的 API 而广受欢迎,这些 API 将控制平面解耦为模块化的控制器。然而,在扩展突发的 FaaS 实例时,消息传递成为主要瓶颈,因为控制器必须通过 API Server 交换大量状态。现有方案倾向于对集群管理器进行全新设计,但这会牺牲与现有生态系统的兼容性并需要大量工程投入。
我们提出 KUBEDIRECT,一种基于 Kubernetes 的 FaaS 集群管理器。我们发现 FaaS 平台中存在一个共同的“窄腰”结构,使我们能够同时实现高效性和外部兼容性。我们的洞见在于,窄腰的顺序结构消除了单一真相来源的需求,从而可以绕过 API Server,直接进行消息传递以提升效率。然而,这种做法在控制器之间引入了一组瞬态状态,使得在缺乏集中协调的情况下实现端到端语义变得困难。
KUBEDIRECT 采用一种新颖的状态管理方案,将窄腰用作层次化的写回缓存,确保一致性并收敛到期望状态。KUBEDIRECT 可以无缝集成到 Kubernetes 中,每个控制器仅需添加约 150 行代码。实验表明,KUBEDIRECT 将服务延迟降低了 26.7×,并且性能可与最先进的全新设计平台 Dirigent 相媲美。
关键贡献
- 引入 KUBEDIRECT,一种兼容 Kubernetes 的 FaaS 集群管理器。
- 展示基于窄腰的层次化写回缓存用于状态一致性。
- 实现相较于 Knative 26.7× 的延迟降低,且代码增量极小。
- 在保持与现有 Kubernetes 生态系统兼容的同时,匹配全新设计的性能。
方法论
详细方法请参阅完整论文。
实际意义
本研究通过提供一种实用、低开销的解决方案,推动了分布式计算(cs.DC)领域在 Kubernetes 上扩展 FaaS 工作负载的进展。
作者
- Sheng Qi
- Zhiquan Zhang
- Xuanzhe Liu
- Xin Jin
论文信息
- arXiv ID: 2601.19160v1
- 分类: cs.DC
- 发布日期: 2026 年 1 月 27 日
- PDF: Download PDF