作者认为,大型语言模型(LLM)在根本上受到限制,因为它们缺乏传统计算机的持久状态和顺序处理能力。与具有程序计数器和寄存器的中央处理单元(CPU)不同,LLM 在单次调用中处理输入,并在调用返回后丢失其先前操作的所有记忆。这种固有的状态缺失意味着 LLM 更像是算术逻辑单元(ALU),而不是完整的计算机器,仅仅增加参数或上下文窗口大小并不能赋予它们运行程序的能力,而运行程序需要一系列依赖的步骤。 AI
影响 这一观点表明,当前的 LLM 开发侧重于扩展类似 ALU 的组件,可能忽略了真正的计算排序和状态管理所需的架构要求。
排序理由 该条目是一篇评论文章,讨论了 LLM 的基本性质及其局限性。
- arithmetic logic unit
- central processing unit
- microcontroller
- random-access memory
- Turing machine
- ZX Spectrum
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →