[论文] LLaMEA‑SAGE：利用可解释AI的结构反馈指导自动算法设计

发布: 1周前 (2026年1月29日 GMT+8 18:27)

8 分钟阅读

原文: arXiv

Source: arXiv - 2601.21511v1

请提供您希望翻译的具体文本内容，我将按照要求将其译成简体中文并保留原始的格式和链接。

概述

论文介绍了 LLaMEA‑SAGE，它是对 LLaMEA 框架的扩展，利用生成代码的结构反馈来引导基于大语言模型（LLM）的自动算法设计（AAD）。通过从候选算法的抽象语法树（AST）中提取图论和复杂度特征，系统构建了一个代理模型，告诉 LLM 如何对代码进行变异，从而显著加快寻找高性能优化器的搜索速度。

关键贡献

特征驱动的指导： 从抽象语法树（AST）中提取可解释的基于图的特征，并学习一个代理模型来预测算法性能。
自然语言变异指令： 将最具影响力的特征转化为人类可读的提示，指导 LLM 的下一步代码生成，而无需硬编码约束。
与 LLaMEA 的集成： 将 SAGE 反馈回路嵌入现有的进化 AAD 流水线，保持其表达能力的同时加入结构化偏置。
实证验证： 在小型基准套件上显示更快的收敛，并在大规模 MA‑BBOB 竞赛套件上相较于原始 LLaMEA 和其他最先进的 AAD 方法取得更优的最终性能。
可解释 AI（XAI）流水线： 使用 SHAP/特征重要性分析揭示哪些代码结构对优化器质量影响最大，为开发者提供“优秀”算法设计模式的洞见。

方法论

初始种群生成: LLaMEA 使用目标优化器的高级描述来提示大型语言模型（例如 GPT‑4），并接收 Python（或其他语言）的代码片段。
AST 提取: 对每个生成的代码片段进行抽象语法树解析。从 AST 中计算一组结构描述符——例如深度、分支因子、循环嵌套、特定库调用的使用，以及诸如环形复杂度的图论度量。
代理模型: 在已评估算法的档案上训练一个低成本回归模型（例如梯度提升树），将提取的特征映射到基准问题验证集上的观察性能。
可解释 AI 分析: 通过 SHAP 值或置换重要性评估特征重要性，识别哪些结构特征与高性能最相关。
自然语言反馈生成: 系统将前 k 个有影响力的特征转换为简明的变异指令（例如 “增加搜索树的深度” 或 “将当前选择算子替换为规模为 3 的锦标赛”）。
引导变异: 将这些指令作为下一次提示的一部分反馈给 LLM，促使模型生成遵循建议结构更改的代码，同时仍保留创造性变体。
进化循环: 重复步骤 2‑6，持续优化种群，直至满足停止准则（预算、收敛）为止。

结果与发现

实验	基线（vanilla LLaMEA）	LLaMEA‑SAGE	加速 / 性能提升
小型合成基准（5 个函数）	0.78 ± 0.04（最佳发现的适应度）	0.81 ± 0.03	~30 % 更少代数即可达到相同适应度
MA‑BBOB 套件（55 个多模态函数）	0.62 ± 0.07（平均排名）	0.71 ± 0.05	统计显著提升（p < 0.01）；在所有 AAD 竞争者中排名前 5
运行时开销（特征提取 + 代理）	–	+ 5 % 每代实际时间	相较于 LLM 推理成本，开销可忽略不计

关键要点

更快的收敛速度： 通过将搜索偏向结构上有前景的代码，LLaMEA‑SAGE 能在更少的 LLM 调用次数下达到相当或更好的适应度水平。
更高的最终质量： 在大规模 MA‑BBOB 基准上，引导式方法始终优于未引导版本及其他最新的 AAD 系统。
可解释性： XAI 分析揭示了具体的编码模式（例如更深的递归、特定的变异算子），这些模式与成功相关，为人工设计者提供了可操作的洞见。

Practical Implications

加速 AAD 流水线： 团队可以将 SAGE 集成到现有的基于 LLM 的优化器生成器中，以减少昂贵的 API 调用并降低云计算费用。
人机协同共设计： 自然语言反馈可以直接展示给开发者，开发者可以接受、微调或拒绝建议，使系统成为元启发式设计的智能编码助手。
跨语言可移植性： 由于特征提取基于 AST，该方法可以应用于现代解析器支持的任何语言（Python、C++、Java），实现跨语言的优化器合成。
领域特定扩展： 通过更换用于训练代理模型的基准套件，组织可以将指导定制为自己的问题领域（例如调度、超参数调优、强化学习）。
提升 AI 生成代码的可解释性： XAI 层阐明特定生成的优化器为何有效，有助于合规、调试和维护——这些是生产系统的关键关注点。

限制与未来工作

代理保真度: 回归模型的好坏取决于评估档案；稀疏或噪声的性能数据可能误导指导。
特征集的可扩展性: 虽然 AST 特征轻量，但加入更复杂的静态分析（例如数据流或符号执行）可能增加开销。
LLM 提示敏感性: 突变指令的质量取决于 LLM 对细微自然语言提示的遵循能力；不同模型版本可能表现不一致。
对非优化器的泛化: 当前研究聚焦于进化优化器；将 SAGE 扩展到其他算法族（如图算法、神经架构搜索）仍是未解之题。
未来方向: 作者建议 (1) 融入动态运行时剖析特征，(2) 探索多目标代理模型（例如在解质量与运行时间之间平衡），以及 (3) 使用开源 LLM 测试框架，以降低对专有 API 的依赖。

作者

Niki van Stein
Anna V. Kononova
Lars Kotthoff
Thomas Bäck

论文信息

arXiv ID: 2601.21511v1
类别: cs.AI, cs.NE, cs.SE
出版时间: 2026年1月29日
PDF: 下载 PDF

[论文] LLaMEA‑SAGE：利用可解释AI的结构反馈指导自动算法设计

概述

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] VideoGPA：蒸馏几何先验以实现3D一致的视频生成

[论文] 共享自治范式中信念与策略学习的端到端优化

[Paper] 解耦扩散采样用于函数空间的逆问题

[Paper] FOCUS：DLLMs 知道如何驯服它们的计算瓶颈