Qwen3.6-35B-A3B 在我的笔记本电脑上为我画了一个比 Claude Opus 4.7 更好的鹈鹕

发布: 3周前 (2026年4月17日 GMT+8 01:37)

4 分钟阅读

Source: Hacker News

2026年4月16日

Qwen 3.6‑35B‑A3B

使用由 Unsloth 提供的 20.9 GB Qwen3.6‑35B‑A3B‑UD‑Q4_K_S.gguf 量化模型生成，在 MacBook Pro M5 上通过 LM Studio（以及 llm‑lmstudio 插件）运行。
文字记录

自行车车架形状正确。天空中有云。鹈鹕背着一个笨拙的袋子。地面上的字幕写着“骑自行车的鹈鹕！”

使用 Anthropic 全新推出的 Claude Opus 4.7 生成。
文字记录

自行车车架完全是错误的形状。没有云，只有一轮黄色的太阳。鹈鹕在向后看，袋子也没有我想要的那么明显。

我把这张图交给 Qwen 3.6。Opus 把自行车车架搞砸了！

使用 thinking_level: max 的第二次尝试并没有显著提升结果。
文字记录

自行车车架仍然是错误的形状，只是以不同的方式。线条更粗。鹈鹕看起来更像鹈鹕。

很多人坚信实验室在为我的愚蠢基准进行训练。我不这么认为，但老实说，这个结果让我有点怀疑。所以我把我的一个秘密备份测试点燃——下面是我用 Qwen 3.6‑35B‑A3B 和 Opus 4.7 生成的“生成一幅鹤骑独轮车的 SVG”。我也把这张交给 Qwen，部分原因是它的优秀 “ SVG 注释。

鹈鹕基准一直是个玩笑——它主要是对比较这些模型的任务有多么晦涩和荒唐的声明。

这个玩笑的奇怪之处在于，在大多数情况下，生成的鹈鹕质量与模型的整体实用性之间存在直接关联。那些2024年10月的首批鹈鹕是垃圾。最近的作品普遍好得多——甚至到了 Gemini 3.1 Pro 能够生成你真的可以在某处使用的插图的程度，只要你真的需要一幅鹈鹕骑自行车的图。

今天，这种与实用性的松散联系已经被打破。我对 Qwen 十分敬佩，但我非常怀疑他们最新模型的 21 GB 量化版本是否比 Anthropic 最新的专有发布更强大或更有用。

如果你现在需要的是一幅鹈鹕骑自行车的 SVG 插图，那么在笔记本电脑上运行的 Qwen 3.6‑35B‑A3B 目前比 Opus 4.7 更值得选择！