[Paper] 自适应 Surrogate-Based 策略用于加速求解昂贵的无约束多目标优化问题的收敛速度
发布: (2026年1月29日 GMT+8 23:46)
8 分钟阅读
原文: arXiv
Source: arXiv - 2601.21885v1
概述
本文介绍了一种 自适应代理‑基加速器,可嵌入现有的多目标进化算法(MOEAs),在优化的早期阶段显著减少昂贵的适应度评估次数。通过用快速的学习近似代替成本高昂的真实评估,该方法使得 MOEAs 在大规模环境建模等计算密集型真实问题中变得可行。
关键贡献
- 双环结构:外环运行传统的 MOEA(如 NSGA‑II、MOEA/D)进行真实评估,内环则反复训练并查询代理模型以指导搜索。
- 自适应代理选择:系统会根据当前数据质量和预测置信度自动在三类代理模型——高斯过程回归(GPR)、一维卷积神经网络(CNN‑1D)和随机森林回归(RFR)——之间进行选择。
- 早期收敛加速:在 31 套基准测试和北海鱼类丰度案例研究中,实验结果显示可将达到相当帕累托前沿质量所需的真实评估次数降低 3–5 倍。
- 框架无关集成:加速器可以包装在任何现成的 MOEA 之上,无需修改其内部算子,既保持算法保证,又提升速度。
方法论
- 基线 MOEA(宿主) – 正常运行,生成候选解并偶尔调用真实的、昂贵的适应度函数(例如,高保真模拟)。
- 数据收集 – 将每一次真实评估存入不断增长的决策向量 ↔ 目标值数据集。
- 代理模型训练 – 在预定义的“热身”阶段后,系统在收集的数据上训练三种代理模型:
- GPR 用于平滑、低维问题(提供不确定性估计)。
- CNN‑1D 用于决策向量具有空间或时间结构的问题(例如,时间序列控制参数)。
- RFR 用于高维、噪声较大的搜索空间。
- 自适应选择 – 加速器评估每个代理模型的交叉验证误差,并在可用时考虑其预测方差。选择在准确性与置信度之间取得最佳平衡的模型用于下一次内部循环迭代。
- 内部循环(加速器) – 选定的代理模型为一批新生成的候选解预测适应度。那些拥有有前景的代理分数的候选解会被 提升 到外部循环进行真实评估,而其余的则被丢弃或保留以待后续精炼。
- 迭代精炼 – 随着真实评估数量的增加,代理模型会被重新训练,逐步提升其保真度,从而使外部 MOEA 更快收敛。
整个流程轻量化:代理模型训练在 CPU 上完成(CNN 可使用普通 GPU),内部循环每秒可评估数千个候选解,远快于原始模拟。
结果与发现
| 测试集 | 基准 MOEA(真实评估次数) | 代理加速 MOEA | 加速比(早期阶段) |
|---|---|---|---|
| 31 个基准问题(ZDT、DTLZ、WFG 系列) | 10 000 次评估以达到 IGD ≤ 0.01 | 2 000–3 500 次评估实现相同 IGD | 3–5× |
| 北海鱼类丰度模型(真实案例) | 8 000 次高成本仿真 | 1 800 次仿真 + 6 200 次代理调用 | ≈ 4.5× 的壁钟时间缩减 |
- Pareto 前沿质量(通过 Inverted Generational Distance 和 Hypervolume 衡量)在早期加速后与基准结果在统计上无显著差异。
- 模型选择动态:在数据稀缺时 GPR 占主导,随着维度增大 RFR 接管,而当决策向量呈现明显的序列模式时,CNN‑1D 成为更优选择。
- 鲁棒性:该方法在不同的 MOEA 变体(NSGA‑II、MOEA/D)以及问题规模(2–10 个目标,10–200 个决策变量)下均保持优势。
实际意义
- 成本效益高的研发:对运行昂贵 CFD、气候或生物仿真循环的公司而言,现在可以将加速器嵌入现有的演化管线,在原型阶段将计算预算削减高达 80 %。
- 更快的上市时间:产品设计团队能够在数小时而非数天内对多目标权衡(例如重量‑强度‑成本)进行迭代,从而更积极地探索设计空间。
- 边缘兼容的优化:由于代理模型推理成本低,内部循环可以卸载到边缘设备或低功耗服务器上,实现对一整套 IoT 传感器或自主代理的分布式优化。
- 即插即用的工具:作者发布了一个 Python 包(
surrogate‑moea),它封装了DEAP、pymoo或任何自定义的 MOEA,只需提供可调用的适应度函数。开发者因此可以在几乎不改动代码的情况下采用该技术。
限制与未来工作
- 代理可靠性:该方法依赖于代理的准确性;在高度混沌或不连续的适应度景观中,预测误差可能误导搜索,需要更频繁地进行真实评估。
- GPR 的可扩展性:高斯过程的计算复杂度随训练点数量呈立方增长,因此对于需要 > 10 000 次真实评估的问题,作者建议使用稀疏 GP 变体或切换到随机森林回归(RFR)。
- 领域特定特征工程:当决策向量具有固有顺序时,CNN‑1D 代理表现最佳;其他问题类型可能需要定制的网络结构。
- 未来方向:作者计划研究主动学习策略,以更智能地选择哪些由代理预测的候选解进行提升,并整合强化学习控制器,根据收敛信号动态调整内部循环预算。
作者
- Tiwonge Msulira Banda
- Alexandru‑Ciprian Zăvoianu
论文信息
- arXiv ID: 2601.21885v1
- 类别: cs.NE
- 发表时间: 2026年1月29日
- PDF: 下载 PDF