[Paper] 延迟感知多阶段边缘服务器升级与预算约束

发布: (2025年12月19日 GMT+8 01:25)
8 min read
原文: arXiv

Source: arXiv - 2512.16792v1

(请提供需要翻译的正文内容,我将按照要求进行简体中文翻译。)

概述

本文提出了 多阶段边缘服务器升级(M‑ESU),这是一种规划框架,帮助运营商在多年内逐步演进多接入边缘计算(MEC)基础设施,同时在每个阶段保持固定预算。通过联合决定 在何处新增边缘服务器、哪些现有服务器需要升级以及如何进行任务卸载,作者旨在在工作负载增长且需求更高的情况下,最大化满足用户请求延迟要求的比例。

关键贡献

  • 对多阶段 MEC 升级问题的形式化定义,捕捉现实约束:每阶段预算、硬件成本折旧、任务量演变、更大的有效负载以及更严格的延迟界限。
  • 两种求解方法
    1. 针对小规模网络的精确混合整数线性规划(MILP)模型。
    2. 可扩展的启发式算法(M‑ESU/H),在大规模部署中提供接近最优的决策。
  • 全面评估表明,启发式算法在小实例上与 MILP 最优解的差距不超过 1.25 %,并在大网络上相较于三种基线启发式在任务满意度比例上提升最高可达 21.57 %
  • 实用指南,阐述在滚动预算情境下如何在服务器部署与容量升级之间取得平衡。

方法论

  1. 系统模型 – 作者对一组边缘站点进行建模,每个站点都有现有的计算容量,并且有新增服务器或升级现有服务器的成本。用户任务以已知的大小分布、增长率和截止期限约束到达,且每个阶段的约束会变得更严格。

  2. 决策变量 – 对于每个阶段,优化器选择:

    • Deploy(二进制)– 是否在站点安装全新服务器。
    • Upgrade(二进制)– 是否增加现有服务器的 CPU 核心/内存。
    • Offload(连续)– 路由到每台服务器的任务比例。
  3. 目标 – 最大化 平均任务满意度比率,即在所有阶段中按时完成的任务比例。

  4. 约束条件 – 包括每阶段预算、资本支出的折旧、服务器容量限制以及不断变化的需求概况。

  5. 解决策略

    • MILP:将问题编码为带整数变量的线性规划;使用商业求解器求解小规模拓扑(≤ 10 个站点)。
    • M‑ESU/H 启发式:基于贪婪的算法,迭代评估每美元支出在任务满意度上的边际增益,在部署和升级操作之间交替进行,同时遵守预算。该启发式在每次硬件决策后还使用简单的线性分配重新优化任务卸载。

结果与发现

场景方法与最优差距(小)相较 MILP 的加速比相较基线的改进(大)
≤ 10 个边缘站点M‑ESU/H vs. MILP≤ 1.25 %10³–10⁴× 更快
50–200 个边缘站点M‑ESU/H vs. Deploy‑Only heuristic+12.3 %+21.57 % 任务满意度
200+ 个边缘站点M‑ESU/H vs. Upgrade‑First heuristic+9.8 %+15.4 % 任务满意度
  • 预算敏感性:在每阶段预算更紧的情况下,启发式算法会自动倾向于升级(边际收益更低),而不是新部署,从而保持满意度水平。
  • 需求增长:随着任务量以 10 %/年增长且截止期限缩短,部署‑升级组合策略能够保持比任何单一聚焦策略更高的满意度比例。
  • 可扩展性:该启发式算法的运行时间随站点数量呈线性增长,适用于全市范围的 MEC 部署。

实际意义

  • 路线图规划 – 网络运营商可以使用 M‑ESU/H 生成多年度升级日历,使资本支出与预期流量增长相匹配,避免过度配置。
  • 动态卸载 – 框架的卸载组件可以集成到现有的边缘编排器(例如基于 Kubernetes 的边缘集群)中,以在每次硬件更改后自动重新平衡工作负载。
  • 成本效益扩展 – 通过量化新增节点与提升现有节点之间的权衡,工程师可以在财政约束下做出数据驱动的决策,最大化投资回报率。
  • 供应商无关 – 该模型仅需成本、容量和折旧等输入,因此可在不考虑硬件供应商或云边提供商的情况下使用。
  • 边缘 AI 工作负载 – 对于对延迟敏感的 AI 推理(如 AR/VR、自动驾驶),该方法确保边缘基础设施能够快速演进,以满足日益严格的延迟 SLA。

限制与未来工作

  • 静态需求预测 – 当前模型假设增长率是确定性的;实际需求可能是突发的或季节性的。引入随机需求或基于学习的预测将提升鲁棒性。
  • 单目标关注 – 最大化任务满意度忽略了能源消耗或可靠性等其他QoS维度;多目标扩展可能有价值。
  • 硬件异构性 – 启发式方法将所有服务器视为可互换的升级对象;未来工作可以对不同硬件代(GPU、TPU)及其特定的成本‑性能曲线进行建模。
  • 实时再优化 – 本研究评估的是离线、分阶段的规划。将算法集成到能够对突发负载做出响应的在线控制器中是一个未解决的研究方向。

作者

  • Endar Suprih Wihidayat
  • Sieteng Soh
  • Kwan‑Wu Chin
  • Duc‑son Pham

论文信息

  • arXiv ID: 2512.16792v1
  • 分类: cs.DC, cs.AI
  • 发表时间: 2025年12月18日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »