研究人员发现了一个关键限制,即Transformer模型在回溯搜索中处理序列化轨迹数据的方式。这些模型在“分散检索”(状态特征分散在多个位置)和“历史纠缠”(模型依赖于轨迹而非当前状态)方面可能存在困难。为解决此问题,他们提出了选择性状态注意力(SSA),这是一种对注意力掩码的结构性修复,可以在不改变训练数据或参数的情况下强制执行基于状态的决策。在3-SAT和图着色等任务上的实验表明,与标准的因果基线模型相比,SSA能够使Transformer基于当前状态做出一致的决策。 AI
影响 引入了一种提高Transformer在搜索任务中可靠性的方法,可能影响依赖于复杂推理和规划的AI系统。
排序理由 学术论文,详细介绍了Transformer在序列化轨迹数据行为方面的一种新诊断和结构性修复方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →