PulseAugur
实时 03:49:52
English(EN) Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7

Qwen 3.6 模型在图像生成基准测试中优于 Anthropic 的 Claude Opus 4.7

最近对 AI 模型的一次比较显示,在笔记本电脑上运行的阿里巴巴 Qwen3.6-35B-A3B 生成的骑自行车的鹈鹕的 SVG 插图优于 Anthropic 的 Claude Opus 4.7。虽然该基准测试旨在对模型评估进行幽默评论,但 Qwen 模型在生成独轮车上火烈鸟的 SVG 时也优于 Opus,甚至包含描述性的 SVG 注释。这一结果挑战了插图质量与模型整体效用之间的普遍相关性,表明专用任务可能由更小、更易于访问的模型更好地处理。 AI

排序理由 该条目讨论了 AI 模型在特定基准测试上的比较,这类似于研究发现或评估。

在 Simon Willison 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Qwen 3.6 模型在图像生成基准测试中优于 Anthropic 的 Claude Opus 4.7

报道来源 [1]

  1. Simon Willison TIER_1 English(EN) ·

    Qwen3.6-35B-A3B 在我的笔记本上画出了比 Claude Opus 4.7 更好的鹈鹕

    <p>For anyone who has been (inadvisably) taking my <a href="https://simonwillison.net/tags/pelican-riding-a-bicycle/">pelican riding a bicycle benchmark</a> seriously as a robust way to test models, here are pelicans from this morning's two big model releases - <a href="https://q…