[Paper] 层次化在线调度用于节能 Split Inference 的渐进式传输
发布: (2026年1月13日 GMT+8 09:56)
7 min read
原文: arXiv
Source: arXiv - 2601.08135v1
概述
本文介绍了 ENACHI,这是一种层次化的在线调度框架,使边缘设备与云/边缘服务器能够协同进行深度神经网络(DNN)推理,同时保持低能耗和严格的延迟。通过在 任务层面(模型在哪里拆分、预留多少带宽)和 分组层面(如何在噪声且时变的信道上传输数据)同时协调决策,ENACHI 在不耗尽设备电池或错过截止时间的前提下,实现了比以往方法更高的准确率。
关键贡献
- 两层李雅普诺夫优化,同时处理长期能耗‑精度权衡(外层循环)和短期信道波动(内层循环)。
- 渐进传输机制,自适应仅发送特征图中最具信息量的部分,减少不必要的数据传输。
- 参考跟踪功率控制,动态调整每个时隙的发射功率,以满足预先计算的能耗预算,同时响应实时信道条件。
- 全面评估在 ImageNet 上显示,在严格的延迟约束下,准确率提升最高 43 %,能耗降低 62 %,并在多用户、拥塞场景中保持稳定性能。
方法论
-
任务级调度(外环)
- 在每个推理请求时,ENACHI 决定 在何处划分 DNN(设备端 vs. 边缘端)以及分配多少 带宽。
- 它使用 漂移加惩罚 形式化: “漂移” 使长期能耗保持在参考预算附近,而 “惩罚” 奖励更高的推理准确率。
-
分组级调度(内环)
- 一旦选定划分点,中间特征张量会通过无线链路传输。
- ENACHI 采用 不确定性感知的渐进传输:特征图被划分为若干分组,按对预测置信度的贡献排序;分组会持续发送,直至边缘能够做出置信的决策。
- 参考跟踪控制器 持续调节每个分组的发送功率,确保瞬时功率保持在外环设定的预算附近,同时应对信道衰落。
-
基于 Lyapunov 的稳定性保证
- 两个环通过 Lyapunov 函数耦合,证明系统在保持能量预算不发散的同时,推动准确率指标上升。
结果与发现
| 场景 | 相对于基线的准确率 ↑ | 相对于基线的能耗 ↓ | 延迟影响 |
|---|---|---|---|
| 紧迫截止时间(≤ 30 ms)且带宽受限(2 Mbps) | +43.12 % | ‑62.13 % | 始终满足截止时间 |
| 适中截止时间(≤ 100 ms) | +21 % | ‑35 % | 为额外任务提供少量余量 |
| 多用户(10 台并发设备) | 稳定(≤ 2 % 变动) | 每设备能耗保持不变 | 无额外排队延迟 |
关键要点
- Progressive transmission 将传输的数据量在“易”样本上最多削减 70 %,同时对更难的输入仍会发送额外的数据包。
- reference‑tracking power policy 能在信道 SNR 超过 10 dB 波动时,仍将设备的平均功耗控制在目标预算的 5 % 范围内。
- ENACHI 能平稳扩展:由于外层循环中的共享带宽分配逻辑,增加用户数量不会提升每台设备的能耗。
Practical Implications
- Edge AI 开发者 可以将 ENACHI 集成到中间件层,自动决定最佳的分割点和传输调度,免去针对每个模型或每种网络条件的手动调优。
- 移动和物联网制造商 获得了一种具体方法,可在可变的 Wi‑Fi/5G 条件下延长电池寿命,同时仍提供实时 AI 服务(例如 AR、语音助手)。
- 网络运营商 可以提供一个轻量级 API,报告当前带宽和信道统计信息;ENACHI 利用这些信息在竞争设备之间公平分配资源。
- 渐进式传输 概念可以重新用于其他带宽密集型任务,如视频分析或联邦学习,在这些场景中,提前退出决策可降低通信开销。
限制与未来工作
- 当前设计假设对 Lyapunov 漂移项拥有 完美的信道统计知识;突发的、非平稳的干扰可能会降低性能。
- ENACHI 侧重于 单模型拆分推理;将该框架扩展到 多模型流水线(例如级联检测器)仍是一个待解决的挑战。
- 在真实环境中部署需要 硬件层面的集成(例如芯片级功率控制器),以充分利用参考跟踪策略——未来工作可以在边缘 ASIC 或智能手机上进行原型验证。
底线:ENACHI 证明了精心编排的层次调度策略能够显著提升设备‑边缘协同推理的能效和准确性,为更具响应性和电池友好的边缘 AI 应用铺平了道路。
作者
- Zengzipeng Tang
- Yuxuan Sun
- Wei Chen
- Jianwen Ding
- Bo Ai
- Yulin Shao
论文信息
- arXiv ID: 2601.08135v1
- 分类: cs.NI, cs.DC, cs.LG
- 发布时间: 2026年1月13日
- PDF: 下载 PDF