大型语言模型在长对话中可能表现出不可靠性,这并非由于记忆丧失,而是因为它们对指令的关注度会随时间减弱。研究表明,虽然模型的核心能力可能只略有下降,但其应用规则的一致性会增加一倍以上。这种被称为“中间遗忘”的现象发生的原因是,模型不会均匀地处理对话上下文,长对话开头部分的指令在对话进行过程中不太可能被持续遵循。 AI
影响 突出了在扩展交互中部署大型语言模型的一个关键挑战,表明需要新的方法来维持指令的遵循。
排序理由 该集群讨论了一篇分析大型语言模型在长对话中行为的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →