研究人员发现了一种在长时语言代理中被称为“世界模型崩溃”的现象,并将其与水的沸腾等相变现象进行类比。当参数发生微小变化时,例如状态加载或视野长度,会导致代理的内部世界模型突然退化。对确定性任务家族的分析揭示了一个包含已解决平台期、过渡带和崩溃底部的相图,表明世界状态保真度在行动有效性之前就会下降。研究表明,虽然更强的模型可能会改变临界边界,但它们并不能消除这种定性转变,将世界模型崩溃确定为在长时运行的代理的一个重要瓶颈。 AI
影响 识别出长时AI代理的一个关键瓶颈,表明当前架构可能无法有效扩展以应对复杂、长期的任务。
排序理由 学术论文,详细介绍了AI代理行为中的一种新现象。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →