PulseAugur
实时 06:24:42
实体 RL-Halting

RL-Halting

PulseAugur coverage of RL-Halting — every cluster mentioning RL-Halting across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_117677 ·

    通过学习到的随机停止稳定循环 Transformer

    研究人员开发了一种方法来稳定循环 Transformer 中的外推,这是一种专为可变长度算法任务设计的神经网络架构。虽然这些模型可以很好地泛化到比它们训练时更长的序列,但它们的性能可能很脆弱且高度可变。新方法将随机性引入 Transformer 在训练期间执行的循环次数,这显著降低了分布外方差。此外,还分析了一种称为 RL-Halting 的学习随机调度,表明它可以改善二元加法和 Dyck-1 等任务的准确性-稳定性权衡。