poolside/Laguna-M.1 模型是一款新的225B参数混合专家(MoE)模型,每个token有23B激活参数,专为代理编码和长时任务设计。它采用大型稀疏MoE架构,包含256个专家和top-k=16路由,全局注意力,以及支持交错思考的原生推理。Laguna M.1 在代理基准测试中表现强劲,包括SWE-bench Verified、SWE-bench Multilingual、SWE-bench Pro和Terminal-Bench 2.0,并根据Apache 2.0许可证发布。 AI
影响 该模型在编码基准测试中的强劲表现有望加速开发更强大的软件工程任务AI代理。
排序理由 来自知名实体(poolside)的新模型发布,包含详细的技术规格和基准性能。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Claude Sonnet 4.6
- DeepSeek-V4 Flash
- Devstral 2
- GLM-4.7
- Hugging Face
- poolside/Laguna-M.1
- Qwen3.5-397B-A17B
- SWE-bench Multilingual
- SWE-bench Pro
- SWE-bench Verified
- Terminal-Bench 2.0
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →