PulseAugur
实时 23:15:52
English(EN) Why there is a lack of new 100B-120B models?

AI社区质疑为何缺乏新的100B-120B参数语言模型

r/LocalLLaMA subreddit上的一项讨论突显了社区对100B-120B参数范围内新大型语言模型缺乏的看法。虽然之前存在GPT-OSS-120B、GLM-4.5-AirNemotron-3-Super、Qwen3.5-122B和Mistral-Small-4-119B等模型,但社区注意到这些模型现在已经发布数月。当前发布的新模型要么更小(25B-35B),要么更大(200B+),这引发了关于约120B MoE家族是否已被放弃,或者是否会预期出现此类规模的新模型的猜测。 AI

影响 该讨论突显了LLM市场在100B-120B参数范围内可能存在的空白,引发了对未来发展重点的疑问。

排序理由 该条目是Reddit上关于LLM发布趋势的讨论,而非主要公告或研究论文。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/TechNerd10191 ·

    Why there is a lack of new 100B-120B models?

    <!-- SC_OFF --><div class="md"><p>GPT-OSS-120B was the first model of that family, which was followed by GLM-4.5-Air, Nemotron-3-Super, Qwen3.5-122B, Mistral-Small-4-119B. However, all models are at least 3 months old (10 months for GPT-OSS-120B) and all latest releases are eithe…