Qwen 在 Replicate 上的 Qwen-Image-Edit-Plus 模型初学者指南
Source: Dev.to

这是一篇关于 AI 模型 Qwen-Image-Edit-Plus 的简明指南,模型由 Qwen 维护。如果你喜欢这类分析,欢迎加入 AImodels.fyi 或在 Twitter 上关注我们。
模型概览
qwen-image-edit-plus 是 Qwen 系列图像编辑基础模型的最新迭代,在核心 qwen-image-edit 的基础上,加入了增强的多图像编辑能力和改进的单图像一致性。该模型引入了原生的 ControlNet 支持,功能已超越前代的语义与外观编辑。其架构将 Qwen2.5‑VL 用于语义理解,结合 VAE 编码器以提升视觉保真度,实现双重编码机制,在内容保留与视觉质量之间取得平衡。与标准的 qwen-image 生成模型不同,这一编辑变体侧重于对已有图像进行精确修改,同时保持结构连贯性。
模型输入与输出
模型接受多张输入图像以及描述所需编辑的文本提示,支持从正方形到宽屏等多种宽高比。用户可以通过可配置参数控制生成速度、输出质量以及安全过滤。
输入
- image:JPEG、PNG、GIF 或 WebP 格式的参考图像数组
- prompt:描述期望图像编辑的文字指令
- aspect_ratio:输出尺寸,可选
1:1、16:9、9:16、4:3、3:4或与输入保持一致 - go_fast:布尔值,开启优化推理速度
- seed:可选整数,用于复现结果
- output_format:
WebP、JPG或PNG格式 - output_quality:
0‑100的整数,控制压缩质量 - disable_safety_checker:布尔值,跳过内容过滤
输出
- images:按指定格式和质量生成的编辑后图像数组
能力
该模型在语义编辑方面表现出色…