English(EN) Can Transformers Learn to Verify During Backtracking Search?

新论文发现Transformer在基于状态的搜索决策中存在困难

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-22 04:00

研究人员发现了一个关键限制，即Transformer模型在回溯搜索中处理序列化轨迹数据的方式。这些模型在“分散检索”（状态特征分散在多个位置）和“历史纠缠”（模型依赖于轨迹而非当前状态）方面可能存在困难。为解决此问题，他们提出了选择性状态注意力（SSA），这是一种对注意力掩码的结构性修复，可以在不改变训练数据或参数的情况下强制执行基于状态的决策。在3-SAT和图着色等任务上的实验表明，与标准的因果基线模型相比，SSA能够使Transformer基于当前状态做出一致的决策。 AI

影响引入了一种提高Transformer在搜索任务中可靠性的方法，可能影响依赖于复杂推理和规划的AI系统。

排序理由学术论文，详细介绍了Transformer在序列化轨迹数据行为方面的一种新诊断和结构性修复方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Yin Jun Phua, Tony Ribeiro, Tuan Nguyen, Katsumi Inoue · 2026-05-22 04:00

Transformer能否在回溯搜索中学会验证？

arXiv:2605.22221v1 Announce Type: new Abstract: Backtracking search underlies classical constraint solvers, planners, and theorem provers. Recent transformer-based reasoning systems explore search trees over their own intermediate steps. A common training recipe fits an autoregre…

报道来源 [1]

Transformer能否在回溯搜索中学会验证？

相关实体

相关话题