English(EN) Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7

Qwen 3.6 模型在图像生成基准测试中优于 Anthropic 的 Claude Opus 4.7

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-16 17:16

最近对 AI 模型的一次比较显示，在笔记本电脑上运行的阿里巴巴 Qwen3.6-35B-A3B 生成的骑自行车的鹈鹕的 SVG 插图优于 Anthropic 的 Claude Opus 4.7。虽然该基准测试旨在对模型评估进行幽默评论，但 Qwen 模型在生成独轮车上火烈鸟的 SVG 时也优于 Opus，甚至包含描述性的 SVG 注释。这一结果挑战了插图质量与模型整体效用之间的普遍相关性，表明专用任务可能由更小、更易于访问的模型更好地处理。 AI

排序理由该条目讨论了 AI 模型在特定基准测试上的比较，这类似于研究发现或评估。

在 Simon Willison 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Qwen 3.6 模型在图像生成基准测试中优于 Anthropic 的 Claude Opus 4.7

报道来源 [1]

Simon Willison TIER_1 English(EN) · 2026-04-16 17:16

Qwen3.6-35B-A3B 在我的笔记本上画出了比 Claude Opus 4.7 更好的鹈鹕

<p>For anyone who has been (inadvisably) taking my <a href="https://simonwillison.net/tags/pelican-riding-a-bicycle/">pelican riding a bicycle benchmark</a> seriously as a robust way to test models, here are pelicans from this morning's two big model releases - <a href="https://q…

报道来源 [1]

Qwen3.6-35B-A3B 在我的笔记本上画出了比 Claude Opus 4.7 更好的鹈鹕

相关话题