一篇新发表在arXiv上的论文探讨了语言模型中下一个词元预测的局限性。文章认为,当前在观察到的序列上训练的模型未能完全捕捉语言生成的条件定律,因为它们忽略了非文本的因素,如意图和上下文。研究表明,为了使下一个词元预测真正有用,观察到的文本必须是这些潜在因素的充分统计量,而异构训练语料库常常不满足这一条件。 AI
影响 这篇论文挑战了LLM训练的基本假设,暗示需要超越简单的下一个词元预测的新方法来实现真正的上下文理解。
排序理由 该集群包含一篇讨论语言模型训练理论局限性的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →