研究人员推出了 Laguna M.1 和 Laguna XS.2,这是两款专为长时程、代理编码任务设计的混合专家(Mixture-of-Experts)基础模型。Laguna M.1 拥有 2258 亿个总参数,每个 token 激活 234 亿个参数;Laguna XS.2 拥有 334 亿个总参数,每个 token 激活 30 亿个参数。两款模型均使用内部“模型工厂”系统开发,该系统整合了数据、训练、评估和推理组件,实现了工业化模型开发方法。在代理软件工程和终端基准测试中,这些模型展现出与最先进的开源模型相媲美的性能。Laguna XS.2 的权重现已根据 Apache 2.0 许可证提供。 AI
影响 推出了新的开源代理编码模型,可能推动自动化软件工程领域的发展。
排序理由 该集群描述了在一份技术报告中发布的新 AI 模型,包括它们的架构、训练过程和基准测试性能。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →