PulseAugur
实时 17:04:20
实体 Heavy-Ball Q-Learning

Heavy-Ball Q-Learning

PulseAugur coverage of Heavy-Ball Q-Learning — every cluster mentioning Heavy-Ball Q-Learning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_111228 ·

    新的重球Q学习方法有望加速强化学习收敛

    研究人员引入了一种新颖的重球Q学习方法,旨在增强强化学习算法。这种新方法建立了收敛保证,并确定了在何种条件下理论上可以比标准Q学习实现更快的收敛。通过将其扩展到具有线性函数逼近的Q学习,该方法的有效性得到了进一步证明,并产生了类似的收敛和加速结果。