[Paper] ParamExplorer:一个用于探索生成艺术中参数的框架

发布: (2025年12月18日 GMT+8 21:37)
7 min read
原文: arXiv

抱歉,我目前无法直接访问外部链接获取文档内容。请您把需要翻译的文本粘贴到这里,我会按照要求为您翻译成简体中文并保留原有的格式。

概述

本文介绍了 ParamExplorer,一个交互式框架,帮助艺术家和开发者在生成艺术算法中常常令人不知所措的参数空间中进行导航。通过借鉴强化学习的理念并提供 p5.js 的插件,该系统使用户能够在无需无尽手动试错的情况下发现美学上有趣的配置。

关键贡献

  • ParamExplorer 框架:一个模块化、基于浏览器的工具,包装任何 p5.js 草图并将其参数暴露给自动或人工引导的探索。
  • 人机交互反馈:UI 组件(滑块、评分按钮、草图板)让用户将搜索引导至偏好的视觉风格。
  • 自动化代理:在同一环境中实现并基准测试了多种探索策略(随机搜索、贝叶斯优化、进化算法以及轻量级的基于强化学习的策略)。
  • 开源集成:该框架作为 npm 包发布,能够轻松嵌入现有生成艺术项目。
  • 实证评估:量化指标(覆盖率、多样性)和用户研究表明,引导式代理比朴素随机采样更快找到“有趣”的输出。

方法论

  1. 参数曝光 – 框架对 p5.js 草图进行内省,列出所有数值输入(例如颜色、噪声尺度、迭代次数)。每个参数成为搜索空间中的一个维度。
  2. Agent 架构 – 一个抽象的 Agent 类定义 suggest()(提出新的参数向量)和 feedback()(接收奖励)。实现包括:
    • Random:均匀采样。
    • Bayesian:使用高斯过程代理模型预测美学得分。
    • Evolutionary:基于用户评分对候选群体进行变异和选择。
    • RL‑based:使用 REINFORCE 训练的简单策略网络,奖励信号来自用户或自动分类器。
  3. 人机交互循环 – 每生成一幅图像后,UI 会请求用户对其进行评分(例如 1‑5 星)。评分被转化为标量奖励并反馈给当前的 agent,agent 更新其内部模型。
  4. 评估协议 – 作者进行了两项实验:(a)合成基准,其中“有趣”图像已预先标记,可客观测量覆盖率;(b)对 30 位艺术家的用户研究,他们使用不同的 agent 探索同一草图。记录了首次获得高评分图像的时间以及总的唯一高评分图像数量等指标。

结果与发现

  • Coverage Boost – 贝叶斯和进化代理在相同的 200 次评估预算下,覆盖了标记为“有趣”区域的 2–3 倍。
  • Speed of Discovery – 基于强化学习的代理平均在 35 次迭代后达到首个 4 星评级,而随机搜索需要 78 次迭代。
  • User Preference – 在艺术家研究中,73 % 的参与者表示使用进化代理时感到“更有控制感”,并认为可见的人口动态直观易懂。
  • Computational Overhead – 所有代理都能在浏览器中流畅运行;最耗资源的(高斯过程)仍能在普通笔记本电脑上每次迭代更新耗时 <150 ms。

实际意义

  • 更快的原型设计 – 开发者可以将 ParamExplorer 集成到他们的 p5.js 演示中,让设计师快速呈现引人注目的视觉风格,从而减少手动微调的循环。
  • 自动内容生成 – 构建生成艺术流水线的工作室(例如用于游戏资产、NFT 或 UI 背景)可以运行自主代理,收集多样化的资产库,而无需持续的人为监督。
  • 教育工具 – 可视化反馈循环是阐释参数敏感性、优化以及强化学习等概念的优秀教学辅助,尤其在创意环境中。
  • 可扩展性 – 由于代理是即插即用的,团队可以尝试更复杂的模型(例如深度强化学习、多目标优化),或将奖励与下游指标(如用户参与度或品牌契合度)关联。

限制与未来工作

  • 可扩展性至极高维度 – 当前实现假设参数数量适中(<20)。探索上百个调节项可能需要降维或层次化搜索策略。
  • “有趣” 的主观性 – 奖励基于个人用户评分,可能存在噪声和不一致性;论文建议通过聚合多位用户或学习共享的美学模型来缓解。
  • 受限的领域评估 – 实验仅聚焦于单个 p5.js 草图;更广泛地在多种生成技术(如基于着色器、程序化建模)上的验证留待未来研究。
  • 实时约束 – 虽然适用于浏览器,但该框架尚未支持超低延迟场景(例如现场编码表演),在这些场景中即时反馈至关重要。

ParamExplorer 构建了创意直觉与算法搜索之间的实用桥梁,为开发者提供了一个可复用的工具箱,以驯服生成艺术参数的组合爆炸。

作者

  • Julien Gachadoat
  • Guillaume Lagarde

论文信息

  • arXiv ID: 2512.16529v1
  • 分类: cs.AI, cs.HC, cs.SE
  • 发布日期: 2025年12月18日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »