PulseAugur
实时 20:18:30
English(EN) Was BitNet a dead end? What happened to ternary LLMs?

三进制大语言模型在20亿参数处停滞,前沿实验室绕过该方法

三进制大语言模型(使用三值系统表示权重)曾展现出早期潜力,但并未获得显著发展。目前可用的最大三进制模型仅为20亿参数,主要人工智能实验室也未采用此方法。尽管该架构具有潜在优势,但其停滞不前的原因尚不清楚。 AI

影响 三进制大语言模型未能获得关注,表明此特定架构缺乏行业范围的影响力或采用度。

排序理由 该集群讨论了三进制大语言模型停滞不前的发展,这是对过去趋势的评论,而不是新发布或重大事件。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/3ntrope ·

    Was BitNet a dead end? What happened to ternary LLMs?

    <!-- SC_OFF --><div class="md"><p>They seemed so promising at one point but the biggest ternary model is still 2B. What happened? Why aren't the frontier open weights AI labs attempting to use them?</p> </div><!-- SC_ON --> &#32; submitted by &#32; <a href="https://www.reddit.com…