PulseAugur
实时 08:49:28
English(EN) GLM-5.1 Review 2026: MIT 744B MoE That Tops SWE-Bench Pro

Z.ai 的 GLM-5.1 作为开源模型登顶编码基准测试

Z.ai 发布了 GLM-5.1,这是一款拥有 7440 亿参数的混合专家(MoE)模型,在 2026 年 4 月的 SWE-Bench Pro 排行榜上取得了 58.4% 的分数。这是首个在这一测试真实世界编码能力的基准测试中超越 GPT-5.4Claude Opus 4.6 等领先的专有模型的开源权重模型。虽然该模型专为自主软件开发任务设计,但其 MIT 许可证允许不受限制的商业使用和修改,这使其区别于其他顶级模型。 AI

影响 为开源模型在编码基准测试上设定了新的 SOTA(State-of-the-Art),可能加速软件开发代理的采用和研究。

排序理由 开源模型发布,基准测试结果超越 SOTA。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Jovan Chan ·

    GLM-5.1 Review 2026: MIT 744B MoE That Tops SWE-Bench Pro

    <blockquote> <p>This article was originally published on <a href="https://aifoss.dev/blog/glm-5-1-review-2026/" rel="noopener noreferrer">aifoss.dev</a></p> </blockquote> <p><strong>TL;DR</strong>: GLM-5.1 is a 744B MIT-licensed MoE model from Z.ai that scored 58.4% on SWE-Bench …