JetBrains 发布 Mellum 2 专注编码的 MoE 模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-01 13:23

JetBrains 发布了 Mellum 2，这是一款专为编码任务设计的新型混合专家（MoE）模型。该模型声称在编码性能上可媲美 Qwen 3.5 9B，但据报道其通用推理能力弱于 Qwen 3.5 4B。这些模型可在 Hugging Face 上获取，并附有详细介绍其性能的技术报告。 AI

影响为编码任务提供了一个新的开源模型选项，有可能提高开发者的生产力。

排序理由这是公司发布的一个新模型，附有技术报告和基准测试声明，符合研究类别。[lever_c_降级自研究：ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 Deutsch(DE) · /u/Middle_Bullfrog_6173 · 2026-06-01 13:23

Mellum 2 12B A2.5B

<div class="md"><p>Coding focused small MoE from JetBrains. They claim coding performance around Qwen 3.5 9B for the reasoning model. Worse than Qwen 3.5 4B in in everything else.</p> <p>Models: <a href="https://huggingface.co/collections/JetBrains/mellum-2">https:…