PulseAugur
实时 15:03:26

JetBrains发布Mellum2推理模型,支持131K上下文

JetBrains发布了其Mellum2模型系列,包括Mellum2-12B-A2.5B-Thinking变体,该模型专为复杂的推理任务设计。该模型采用了混合专家(Mixture-of-Experts)架构,并拥有131,072个token的大上下文窗口。此次发布提供了将该模型与Transformers、vLLM和SGLang等各种库和工具集成的详细说明。 AI

影响 通过开源模型,使开发人员能够将高级推理能力集成到应用程序中。

排序理由 该集群描述了公司发布的一个开源模型,并附有详细的使用说明,符合研究类别。

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

JetBrains发布Mellum2推理模型,支持131K上下文

报道来源 [2]

  1. Hugging Face Trending Models TIER_1 English(EN) · JetBrains ·

    JetBrains/Mellum2-12B-A2.5B-Thinking

    text-generation · 80 downloads · 54 likes

  2. r/LocalLLaMA TIER_1 English(EN) · /u/DeltaSqueezer ·

    JetBrains open-sources Mellum2 - anyone tried these?

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tukilx/jetbrains_opensources_mellum2_anyone_tried_these/"> <img alt="JetBrains open-sources Mellum2 - anyone tried these?" src="https://external-preview.redd.it/mCzuTq8n7xvCy4rmMbMCcp0ElWqSR8knfaLcaG2VOdU.jpe…