PulseAugur
实时 00:19:46
English(EN) Can Transformers Learn to Verify During Backtracking Search?

新论文发现Transformer在基于状态的搜索决策中存在困难

研究人员发现了一个关键限制,即Transformer模型在回溯搜索中处理序列化轨迹数据的方式。这些模型在“分散检索”(状态特征分散在多个位置)和“历史纠缠”(模型依赖于轨迹而非当前状态)方面可能存在困难。为解决此问题,他们提出了选择性状态注意力(SSA),这是一种对注意力掩码的结构性修复,可以在不改变训练数据或参数的情况下强制执行基于状态的决策。在3-SAT和图着色等任务上的实验表明,与标准的因果基线模型相比,SSA能够使Transformer基于当前状态做出一致的决策。 AI

影响 引入了一种提高Transformer在搜索任务中可靠性的方法,可能影响依赖于复杂推理和规划的AI系统。

排序理由 学术论文,详细介绍了Transformer在序列化轨迹数据行为方面的一种新诊断和结构性修复方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Yin Jun Phua, Tony Ribeiro, Tuan Nguyen, Katsumi Inoue ·

    Transformer能否在回溯搜索中学会验证?

    arXiv:2605.22221v1 Announce Type: new Abstract: Backtracking search underlies classical constraint solvers, planners, and theorem provers. Recent transformer-based reasoning systems explore search trees over their own intermediate steps. A common training recipe fits an autoregre…