[Paper] 层次化在线调度用于节能 Split Inference 的渐进式传输

发布: (2026年1月13日 GMT+8 09:56)
7 min read
原文: arXiv

Source: arXiv - 2601.08135v1

概述

本文介绍了 ENACHI,这是一种层次化的在线调度框架,使边缘设备与云/边缘服务器能够协同进行深度神经网络(DNN)推理,同时保持低能耗和严格的延迟。通过在 任务层面(模型在哪里拆分、预留多少带宽)和 分组层面(如何在噪声且时变的信道上传输数据)同时协调决策,ENACHI 在不耗尽设备电池或错过截止时间的前提下,实现了比以往方法更高的准确率。

关键贡献

  • 两层李雅普诺夫优化,同时处理长期能耗‑精度权衡(外层循环)和短期信道波动(内层循环)。
  • 渐进传输机制,自适应仅发送特征图中最具信息量的部分,减少不必要的数据传输。
  • 参考跟踪功率控制,动态调整每个时隙的发射功率,以满足预先计算的能耗预算,同时响应实时信道条件。
  • 全面评估在 ImageNet 上显示,在严格的延迟约束下,准确率提升最高 43 %,能耗降低 62 %,并在多用户、拥塞场景中保持稳定性能。

方法论

  1. 任务级调度(外环)

    • 在每个推理请求时,ENACHI 决定 在何处划分 DNN(设备端 vs. 边缘端)以及分配多少 带宽
    • 它使用 漂移加惩罚 形式化: “漂移” 使长期能耗保持在参考预算附近,而 “惩罚” 奖励更高的推理准确率。
  2. 分组级调度(内环)

    • 一旦选定划分点,中间特征张量会通过无线链路传输。
    • ENACHI 采用 不确定性感知的渐进传输:特征图被划分为若干分组,按对预测置信度的贡献排序;分组会持续发送,直至边缘能够做出置信的决策。
    • 参考跟踪控制器 持续调节每个分组的发送功率,确保瞬时功率保持在外环设定的预算附近,同时应对信道衰落。
  3. 基于 Lyapunov 的稳定性保证

    • 两个环通过 Lyapunov 函数耦合,证明系统在保持能量预算不发散的同时,推动准确率指标上升。

结果与发现

场景相对于基线的准确率 ↑相对于基线的能耗 ↓延迟影响
紧迫截止时间(≤ 30 ms)且带宽受限(2 Mbps)+43.12 %‑62.13 %始终满足截止时间
适中截止时间(≤ 100 ms)+21 %‑35 %为额外任务提供少量余量
多用户(10 台并发设备)稳定(≤ 2 % 变动)每设备能耗保持不变无额外排队延迟

关键要点

  • Progressive transmission 将传输的数据量在“易”样本上最多削减 70 %,同时对更难的输入仍会发送额外的数据包。
  • reference‑tracking power policy 能在信道 SNR 超过 10 dB 波动时,仍将设备的平均功耗控制在目标预算的 5 % 范围内。
  • ENACHI 能平稳扩展:由于外层循环中的共享带宽分配逻辑,增加用户数量不会提升每台设备的能耗。

Practical Implications

  • Edge AI 开发者 可以将 ENACHI 集成到中间件层,自动决定最佳的分割点和传输调度,免去针对每个模型或每种网络条件的手动调优。
  • 移动和物联网制造商 获得了一种具体方法,可在可变的 Wi‑Fi/5G 条件下延长电池寿命,同时仍提供实时 AI 服务(例如 AR、语音助手)。
  • 网络运营商 可以提供一个轻量级 API,报告当前带宽和信道统计信息;ENACHI 利用这些信息在竞争设备之间公平分配资源。
  • 渐进式传输 概念可以重新用于其他带宽密集型任务,如视频分析或联邦学习,在这些场景中,提前退出决策可降低通信开销。

限制与未来工作

  • 当前设计假设对 Lyapunov 漂移项拥有 完美的信道统计知识;突发的、非平稳的干扰可能会降低性能。
  • ENACHI 侧重于 单模型拆分推理;将该框架扩展到 多模型流水线(例如级联检测器)仍是一个待解决的挑战。
  • 在真实环境中部署需要 硬件层面的集成(例如芯片级功率控制器),以充分利用参考跟踪策略——未来工作可以在边缘 ASIC 或智能手机上进行原型验证。

底线:ENACHI 证明了精心编排的层次调度策略能够显著提升设备‑边缘协同推理的能效和准确性,为更具响应性和电池友好的边缘 AI 应用铺平了道路。

作者

  • Zengzipeng Tang
  • Yuxuan Sun
  • Wei Chen
  • Jianwen Ding
  • Bo Ai
  • Yulin Shao

论文信息

  • arXiv ID: 2601.08135v1
  • 分类: cs.NI, cs.DC, cs.LG
  • 发布时间: 2026年1月13日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »