Deutsch(DE) A Simple Coding Benchmark: Step 3.7 vs Qwen 3.5 122B-A10B vs Qwen 3.6 27B vs Qwen 3.6 35B-A3B

Qwen 模型在编码基准测试中表现强劲，优于 Step 3.7

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 17:24

一位Reddit用户发布了一项编码基准测试结果，该测试比较了几款Qwen模型与Step 3.7的性能。该基准测试侧重于评估模型在编码任务中的表现。结果表明，Qwen 3.5 122B-A10B 和 Qwen 3.6 35B-A3B 在此特定的编码评估中表现尤为出色。 AI

影响提供了关于不同Qwen模型编码能力的见解，有助于开发人员选择用于编码任务的模型。

排序理由用户生成的多个LLM的基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 Deutsch(DE) · /u/remeh · 2026-06-02 17:24

一个简单的编码基准测试：Step 3.7 vs Qwen 3.5 122B-A10B vs Qwen 3.6 27B vs Qwen 3.6 35B-A3B

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tuxspu/a_simple_coding_benchmark_step_37_vs_qwen_35/"> <img alt="A Simple Coding Benchmark: Step 3.7 vs Qwen 3.5 122B-A10B vs Qwen 3.6 27B vs Qwen 3.6 35B-A3B" src="https://external-preview.redd.it/BOBcJN5jRz…