实体 RL-Halting

RL-Halting

PulseAugur coverage of RL-Halting — every cluster mentioning RL-Halting across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_117677 · Jun 30 · 04:00

通过学习到的随机停止稳定循环 Transformer

研究人员开发了一种方法来稳定循环 Transformer 中的外推，这是一种专为可变长度算法任务设计的神经网络架构。虽然这些模型可以很好地泛化到比它们训练时更长的序列，但它们的性能可能很脆弱且高度可变。新方法将随机性引入 Transformer 在训练期间执行的循环次数，这显著降低了分布外方差。此外，还分析了一种称为 RL-Halting 的学习随机调度，表明它可以改善二元加法和 Dyck-1 等任务的准确性-稳定性权衡。