一位 r/LocalLLaMA 上的用户分享了对 JetBrains Mellum 2 的积极评价,这是一款 12B 的专家混合(Mixture-of-Experts)模型。尽管体积不大,该模型却展现出令人印象深刻的性能,生成速度达到 111.2 t/s,并且在 AMD Radeon RX 7900 XT 上,即使上下文窗口达到 131,072 个 token,其速度仍能保持在 100 t/s 以上。用户强调了它在处理工具调用和数据重建等复杂任务方面的能力,在相同硬件上超越了 Qwen3.5-9B 等其他模型。 AI
影响 该模型的强大性能和大型上下文窗口可能会影响更高效、更强大的本地 LLM 的开发。
排序理由 用户对特定模型发布的评测,详细介绍了性能指标和用例。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →