r/LocalLLaMA subreddit上的一项讨论突显了社区对100B-120B参数范围内新大型语言模型缺乏的看法。虽然之前存在GPT-OSS-120B、GLM-4.5-Air、Nemotron-3-Super、Qwen3.5-122B和Mistral-Small-4-119B等模型,但社区注意到这些模型现在已经发布数月。当前发布的新模型要么更小(25B-35B),要么更大(200B+),这引发了关于约120B MoE家族是否已被放弃,或者是否会预期出现此类规模的新模型的猜测。 AI
影响 该讨论突显了LLM市场在100B-120B参数范围内可能存在的空白,引发了对未来发展重点的疑问。
排序理由 该条目是Reddit上关于LLM发布趋势的讨论,而非主要公告或研究论文。
- DeepSeek-V4-Flash
- Gemma4
- GLM-4.5-Air
- GPT-OSS-120B
- Llama
- MiniMax-M3
- Mistral-Small-4-119B
- Nemotron-3-Super
- Nemotron-3-Ultra
- Qwen3.5-122B
- Qwen3.6
- Step 3.5/3.7 Flash
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →