阿里巴巴的Qwen3-Coder-Next是一个拥有800亿总参数、30亿激活参数的模型,在SWE-Bench Verified基准测试中取得了70.6分。这一成绩尤为引人注目,因为它在提供可下载的Apache 2.0许可权重的同时,能够媲美顶级的闭源模型。该模型采用了稀疏混合专家(MoE)架构和混合注意力机制,结合了用于长上下文的线性注意力与用于全局上下文重建的标准注意力。 AI
影响 为SWE-Bench上的开源代码模型树立了新的SOTA(State-of-the-Art),使先进的代码辅助功能更加普及。
排序理由 该集群详细介绍了一款新的开源模型发布及其基准性能指标。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →