[Paper] 学习增强的在线二分匹配在随机到达顺序模型

发布: 1周前 (2025年11月29日 GMT+8 01:31)

8 min read

原文: arXiv

Source: arXiv - 2511.23388v1

概览

本文研究经典的在线二分匹配问题——类似于将不断到来的任务分配给固定的工人池——在到达顺序随机且算法能够获得每个到来顶点邻域的预测的情形。通过将这些预测与稳健的回退策略相结合，作者提出了一种算法：当预测准确时具有极高的一致性；当预测不可靠时仍能保持可靠的竞争性，即使最优匹配远未达到完美。

预测模型：每个在线顶点到来时伴随一个预测邻域（其可能的离线匹配集合）。这些预测可能带噪，甚至是对抗性的。
抽样‑检测阶段：算法观察前 γ·n 个到来（γ ≪ 1）作为样本，将实际观察到的邻域与预测进行比较，估计整体预测误差。
决策规则：
- 若误差估计低于设定阈值，算法信任预测，按照预测的最优匹配贪心匹配每个新顶点（该匹配保证至少有 α n 条边）。
- 否则，放弃预测，针对剩余到来运行β‑竞争基线（例如经典的 Ranking 算法）。
分析技巧：作者界定样本误判预测质量的概率，然后将两条分支的性能相结合。通过精细选择 γ 和误差阈值，确保错误决策导致的损失仅为低阶项（保证中的 “‑o(1)”）。

一致性：当预测准确（误差 → 0）时，算法几乎匹配所有最优离线解能够匹配的顶点，竞争比达到 1 − o(1)。
鲁棒性：在最坏情况下（预测完全不可信），算法回退到基线，保证竞争比为 β − o(1)，其中 β 是随机顺序在线二分匹配已知的最佳界限（对无权图约为 0.632）。
平滑退化：对于中等误差水平 ε，竞争比在两极之间插值，大致遵循 f(ε) = (1 − ε)·(1 − o(1)) + ε·(β − o(1))。这表明适度的预测误差只会导致适度的性能下降。
无需最优规模假设：不同于先前工作，本文的分析不要求最优匹配是完美的（大小 n），只要预测匹配至少占 α n 即可，即使真实最优远小于 n 也适用。

任务调度与负载均衡：系统接收作业流（在线顶点）并拥有服务器池（离线顶点），可以将机器学习生成的亲和分数作为预测。算法在预测良好时实现近乎最优的吞吐量，模型漂移时安全回退到已验证的在线启发式。
广告分配与推荐：在实时广告竞价或内容推荐中，用户兴趣的预测可视为邻域。该方法在预测可靠时保证高收入，同时防止用户行为突变导致的收益骤降。
边缘计算资源分配：设备连接到边缘节点时常提供估计的连通性概要。利用学习增强匹配，边缘编排器可以快速自信地分配任务，在网络条件估计错误时回退到稳健匹配。
实现简易：算法仅需一个短暂的观察窗口和一个基本的基线匹配器，易于嵌入已使用 Ranking 或 Greedy 匹配器的现有流水线。

总体而言，本文通过放宽限制并提供明确的性能导向路径，使学习增强的在线算法更贴近实际应用，帮助开发者在不牺牲最坏情况保证的前提下利用预测模型提升系统表现。