PulseAugur
实时 22:16:17

Alibaba的Qwen3-Coder-Next在SWE-Bench上取得70.6分,采用稀疏MoE架构

阿里巴巴的Qwen3-Coder-Next是一个拥有800亿总参数、30亿激活参数的模型,在SWE-Bench Verified基准测试中取得了70.6分。这一成绩尤为引人注目,因为它在提供可下载的Apache 2.0许可权重的同时,能够媲美顶级的闭源模型。该模型采用了稀疏混合专家(MoE)架构和混合注意力机制,结合了用于长上下文的线性注意力与用于全局上下文重建的标准注意力。 AI

影响 为SWE-Bench上的开源代码模型树立了新的SOTA(State-of-the-Art),使先进的代码辅助功能更加普及。

排序理由 该集群详细介绍了一款新的开源模型发布及其基准性能指标。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Thousand Miles AI ·

    Qwen3-Coder-Next: 80B total, 3B active, 70.6 on SWE-Bench

    <p>Qwen3-Coder-Next runs 3 billion parameters per token. It scores <strong>70.6 on SWE-Bench Verified</strong> with the SWE-Agent scaffold. Both numbers are true at the same time, and the gap between them is where the interesting architectural ideas live.</p> <h2> TL;DR </h2> <ul…