Z.ai 发布了 GLM-5.1,这是一款拥有 7440 亿参数的混合专家(MoE)模型,在 2026 年 4 月的 SWE-Bench Pro 排行榜上取得了 58.4% 的分数。这是首个在这一测试真实世界编码能力的基准测试中超越 GPT-5.4 和 Claude Opus 4.6 等领先的专有模型的开源权重模型。虽然该模型专为自主软件开发任务设计,但其 MIT 许可证允许不受限制的商业使用和修改,这使其区别于其他顶级模型。 AI
影响 为开源模型在编码基准测试上设定了新的 SOTA(State-of-the-Art),可能加速软件开发代理的采用和研究。
排序理由 开源模型发布,基准测试结果超越 SOTA。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →