Qwen3.6-35B-A3B 在我的笔记本电脑上 为我画了一个比 Claude Opus 4.7 更好的鹈鹕
Source: Hacker News
2026年4月16日
Qwen 3.6‑35B‑A3B
使用由 Unsloth 提供的 20.9 GB Qwen3.6‑35B‑A3B‑UD‑Q4_K_S.gguf 量化模型生成,在 MacBook Pro M5 上通过 LM Studio(以及 llm‑lmstudio 插件)运行。
文字记录

Claude Opus 4.7
使用 Anthropic 全新推出的 Claude Opus 4.7 生成。
文字记录

我把这张图交给 Qwen 3.6。Opus 把自行车车架搞砸了!
Opus with thinking_level: max
使用 thinking_level: max 的第二次尝试并没有显著提升结果。
文字记录

我不认为 Qwen 在作弊
很多人坚信实验室在为我的愚蠢基准进行训练。我不这么认为,但老实说,这个结果让我有点怀疑。所以我把我的一个秘密备份测试点燃——下面是我用 Qwen 3.6‑35B‑A3B 和 Opus 4.7 生成的“生成一幅鹤骑独轮车的 SVG”。我也把这张交给 Qwen,部分原因是它的优秀 “ SVG 注释。
我们能从中学到什么?
鹈鹕基准一直是个玩笑——它主要是对比较这些模型的任务有多么晦涩和荒唐的声明。
这个玩笑的奇怪之处在于,在大多数情况下,生成的鹈鹕质量与模型的整体实用性之间存在直接关联。那些2024年10月的首批鹈鹕是垃圾。最近的作品普遍好得多——甚至到了 Gemini 3.1 Pro 能够生成你真的可以在某处使用的插图的程度,只要你真的需要一幅鹈鹕骑自行车的图。
今天,这种与实用性的松散联系已经被打破。我对 Qwen 十分敬佩,但我非常怀疑他们最新模型的 21 GB 量化版本是否比 Anthropic 最新的专有发布更强大或更有用。
如果你现在需要的是一幅鹈鹕骑自行车的 SVG 插图,那么在笔记本电脑上运行的 Qwen 3.6‑35B‑A3B 目前比 Opus 4.7 更值得选择!