PulseAugur
实时 14:22:09

JetBrains 发布 Mellum 2 专注编码的 MoE 模型

JetBrains 发布了 Mellum 2,这是一款专为编码任务设计的新型混合专家(MoE)模型。该模型声称在编码性能上可媲美 Qwen 3.5 9B,但据报道其通用推理能力弱于 Qwen 3.5 4B。这些模型可在 Hugging Face 上获取,并附有详细介绍其性能的技术报告。 AI

影响 为编码任务提供了一个新的开源模型选项,有可能提高开发者的生产力。

排序理由 这是公司发布的一个新模型,附有技术报告和基准测试声明,符合研究类别。[lever_c_降级自研究:ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 Deutsch(DE) · /u/Middle_Bullfrog_6173 ·

    Mellum 2 12B A2.5B

    <!-- SC_OFF --><div class="md"><p>Coding focused small MoE from JetBrains. They claim coding performance around Qwen 3.5 9B for the reasoning model. Worse than Qwen 3.5 4B in in everything else.</p> <p>Models: <a href="https://huggingface.co/collections/JetBrains/mellum-2">https:…