English(EN) GLM-5.1 Review 2026: MIT 744B MoE That Tops SWE-Bench Pro

Z.ai 的 GLM-5.1 作为开源模型登顶编码基准测试

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 07:03

Z.ai 发布了 GLM-5.1，这是一款拥有 7440 亿参数的混合专家（MoE）模型，在 2026 年 4 月的 SWE-Bench Pro 排行榜上取得了 58.4% 的分数。这是首个在这一测试真实世界编码能力的基准测试中超越 GPT-5.4 和 Claude Opus 4.6 等领先的专有模型的开源权重模型。虽然该模型专为自主软件开发任务设计，但其 MIT 许可证允许不受限制的商业使用和修改，这使其区别于其他顶级模型。 AI

影响为开源模型在编码基准测试上设定了新的 SOTA（State-of-the-Art），可能加速软件开发代理的采用和研究。

排序理由开源模型发布，基准测试结果超越 SOTA。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Jovan Chan · 2026-06-09 07:03

GLM-5.1 Review 2026: MIT 744B MoE That Tops SWE-Bench Pro

<blockquote> This article was originally published on <a href="https://aifoss.dev/blog/glm-5-1-review-2026/" rel="noopener noreferrer">aifoss.dev</a> </blockquote> TL;DR: GLM-5.1 is a 744B MIT-licensed MoE model from Z.ai that scored 58.4% on SWE-Bench …

报道来源 [1]

GLM-5.1 Review 2026: MIT 744B MoE That Tops SWE-Bench Pro

相关实体

相关话题