实体 Heavy-Ball Q-Learning

Heavy-Ball Q-Learning

PulseAugur coverage of Heavy-Ball Q-Learning — every cluster mentioning Heavy-Ball Q-Learning across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

论文 1
其他 1

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_111228 · Jun 25 · 14:48

新的重球Q学习方法有望加速强化学习收敛

研究人员引入了一种新颖的重球Q学习方法，旨在增强强化学习算法。这种新方法建立了收敛保证，并确定了在何种条件下理论上可以比标准Q学习实现更快的收敛。通过将其扩展到具有线性函数逼近的Q学习，该方法的有效性得到了进一步证明，并产生了类似的收敛和加速结果。

新的重球Q学习方法有望加速强化学习收敛