PulseAugur
实时 03:58:28
English(EN) The LLM is an ALU

LLM 是 ALU,不是计算机,缺乏持久状态

作者认为,大型语言模型(LLM)在根本上受到限制,因为它们缺乏传统计算机的持久状态和顺序处理能力。与具有程序计数器和寄存器的中央处理单元(CPU)不同,LLM 在单次调用中处理输入,并在调用返回后丢失其先前操作的所有记忆。这种固有的状态缺失意味着 LLM 更像是算术逻辑单元(ALU),而不是完整的计算机器,仅仅增加参数或上下文窗口大小并不能赋予它们运行程序的能力,而运行程序需要一系列依赖的步骤。 AI

影响 这一观点表明,当前的 LLM 开发侧重于扩展类似 ALU 的组件,可能忽略了真正的计算排序和状态管理所需的架构要求。

排序理由 该条目是一篇评论文章,讨论了 LLM 的基本性质及其局限性。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLM 是 ALU,不是计算机,缺乏持久状态

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Matt ·

    LLM 是一个 ALU

    <h2> Why Your AI Agent Needs a guy who wrote games on a ZX Spectrum </h2> <p>A few weeks ago I was mid-sentence, explaining to my own agent why one of its habits was wasteful, when the habit fired. We were discussing — in the conversation itself — how a skill called "Remember Thi…