JetBrains发布了其Mellum2模型系列,包括Mellum2-12B-A2.5B-Thinking变体,该模型专为复杂的推理任务设计。该模型采用了混合专家(Mixture-of-Experts)架构,并拥有131,072个token的大上下文窗口。此次发布提供了将该模型与Transformers、vLLM和SGLang等各种库和工具集成的详细说明。 AI
影响 通过开源模型,使开发人员能够将高级推理能力集成到应用程序中。
排序理由 该集群描述了公司发布的一个开源模型,并附有详细的使用说明,符合研究类别。
在 Hugging Face Trending Models 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →