English(EN) Jetbrains Mellum 2: a really good and performant model

JetBrains Mellum 2 模型以其速度和上下文处理能力令人印象深刻

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 01:28

一位 r/LocalLLaMA 上的用户分享了对 JetBrains Mellum 2 的积极评价，这是一款 12B 的专家混合（Mixture-of-Experts）模型。尽管体积不大，该模型却展现出令人印象深刻的性能，生成速度达到 111.2 t/s，并且在 AMD Radeon RX 7900 XT 上，即使上下文窗口达到 131,072 个 token，其速度仍能保持在 100 t/s 以上。用户强调了它在处理工具调用和数据重建等复杂任务方面的能力，在相同硬件上超越了 Qwen3.5-9B 等其他模型。 AI

影响该模型的强大性能和大型上下文窗口可能会影响更高效、更强大的本地 LLM 的开发。

排序理由用户对特定模型发布的评测，详细介绍了性能指标和用例。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/gcavalcante8808 · 2026-06-09 01:28

Jetbrains Mellum 2：一个真正优秀且性能卓越的模型

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u0r3jh/jetbrains_mellum_2_a_really_good_and_performant/"> <img alt="Jetbrains Mellum 2: a really good and performant model" src="https://preview.redd.it/h41a3vo5t56h1.png?width=140&height=37&auto=webp…

报道来源 [1]

Jetbrains Mellum 2：一个真正优秀且性能卓越的模型

相关实体

相关话题