Qwen3.6-35B-A3B 在我的笔记本电脑上 为我画了一个比 Claude Opus 4.7 更好的鹈鹕

发布: (2026年4月17日 GMT+8 01:37)
4 分钟阅读

Source: Hacker News

2026年4月16日

Qwen 3.6‑35B‑A3B

使用由 Unsloth 提供的 20.9 GB Qwen3.6‑35B‑A3B‑UD‑Q4_K_S.gguf 量化模型生成,在 MacBook Pro M5 上通过 LM Studio(以及 llm‑lmstudio 插件)运行。
文字记录

自行车车架形状正确。天空中有云。鹈鹕背着一个笨拙的袋子。地面上的字幕写着“骑自行车的鹈鹕!”

Claude Opus 4.7

使用 Anthropic 全新推出的 Claude Opus 4.7 生成。
文字记录

自行车车架完全是错误的形状。没有云,只有一轮黄色的太阳。鹈鹕在向后看,袋子也没有我想要的那么明显。

我把这张图交给 Qwen 3.6。Opus 把自行车车架搞砸了!

Opus with thinking_level: max

使用 thinking_level: max 的第二次尝试并没有显著提升结果。
文字记录

自行车车架仍然是错误的形状,只是以不同的方式。线条更粗。鹈鹕看起来更像鹈鹕。

我不认为 Qwen 在作弊

很多人坚信实验室在为我的愚蠢基准进行训练。我不这么认为,但老实说,这个结果让我有点怀疑。所以我把我的一个秘密备份测试点燃——下面是我用 Qwen 3.6‑35B‑A3B 和 Opus 4.7 生成的“生成一幅鹤骑独轮车的 SVG”。我也把这张交给 Qwen,部分原因是它的优秀 “ SVG 注释。

我们能从中学到什么?

鹈鹕基准一直是个玩笑——它主要是对比较这些模型的任务有多么晦涩和荒唐的声明。

这个玩笑的奇怪之处在于,在大多数情况下,生成的鹈鹕质量与模型的整体实用性之间存在直接关联。那些2024年10月的首批鹈鹕是垃圾。最近的作品普遍好得多——甚至到了 Gemini 3.1 Pro 能够生成你真的可以在某处使用的插图的程度,只要你真的需要一幅鹈鹕骑自行车的图。

今天,这种与实用性的松散联系已经被打破。我对 Qwen 十分敬佩,但我非常怀疑他们最新模型的 21 GB 量化版本是否比 Anthropic 最新的专有发布更强大或更有用。

如果你现在需要的是一幅鹈鹕骑自行车的 SVG 插图,那么在笔记本电脑上运行的 Qwen 3.6‑35B‑A3B 目前比 Opus 4.7 更值得选择!

0 浏览
Back to Blog

相关文章

阅读更多 »

Monero 社区众筹系统

Ideas ANONERO 持续开发 作者:r4v3r23 日期:2026年4月20日 ProbeLab P2P 网络指标提案 作者:dennis-tra 日期:2026年4月9日 monero.ec...