[Paper] SMOG：可扩展的元学习用于多目标贝叶斯优化

发布: 3个月前 (2026年1月30日 GMT+8 02:51)

7 分钟阅读

原文: arXiv

Source: arXiv - 2601.22131v1

概览

本文介绍了 SMOG，一种全新的元学习框架，为多目标贝叶斯优化（MOBO）配备了可扩展、数据驱动的先验。通过利用来自相关优化问题的历史数据，SMOG 能够对寻找 Pareto‑optimal 解的过程进行“热启动”，显著减少在实际工程和机器学习流水线中所需的昂贵黑箱评估次数。

Meta‑task 收集 – 收集一组相关的优化问题（例如，为不同数据集调优超参数）。每个 meta‑task 为所有目标提供一小批输入‑输出对。
Multi‑output GP 构建 – 构建一个 joint GP，同时对所有目标建模，使用可分解为以下两部分的 kernel：
- metadata kernel：将具有相似描述符（例如，数据集规模、硬件规格）的任务关联起来。
- residual multi‑output kernel：捕获 metadata 未解释的任务特定细微差别。
基于 metadata 的条件化 – 当出现新的目标任务时，将其 metadata 输入到 GP 中。模型会解析地积分掉 metadata 的不确定性，得到目标 surrogate 的 closed‑form prior。
层次化训练 –
- Stage 1: 为每个 meta‑task 拟合独立的 GP（可并行）。
- Stage 2: 使用缓存的 Stage‑1 后验，联合学习 metadata 和 residual kernel 的超参数。该步骤随 meta‑task 数量线性扩展。
优化循环 – 在任意标准 MOBO 采集函数（如 EHVI、Pareto‑frontier entropy）中使用得到的 surrogate。采集函数选择下一个黑箱评估，将数据加入 surrogate，循环重复。

Source: …

实验	基准	SMOG（元学习）	加速
合成双目标基准（30 个元任务）	标准 MOBO（无先验）	SMOG 增强的 MOBO	约 2.5 倍更少的评估即可达到 90 % 超体积
多目标神经网络（准确率 vs. 延迟）的超参数调优，跨 10 个数据集	随机搜索 + MOBO	SMOG‑MOBO	GPU 总时长降低 40 %
真实工程设计（重量 vs. 强度），使用 5 条历史设计	进化式 MOEA	SMOG‑MOBO	在一半的预算内收敛到 Pareto 前沿

关键要点

元数据质量依赖 – 该方法假设每个任务都有信息丰富、低维度的描述符；元数据质量差会削弱先验的效果。
高斯过程的可扩展性 – 虽然元训练是线性的，但每个高斯过程仍然在其自身数据规模上具有立方时间成本；对于极大的单任务数据集，可能需要稀疏高斯过程近似。
经验范围有限 – 实验仅覆盖约 30 个元任务；向数百甚至数千任务的扩展仍有待验证。
作者提出的未来方向 包括：将 SMOG 扩展到非高斯似然（例如分类），探索深度核学习以获得更丰富的表示，以及将该框架应用于强化学习的策略搜索，在其中奖励与安全等目标可能冲突。