PulseAugur
实时 18:43:58
实体 Frictional Q-Learning

Frictional Q-Learning

PulseAugur coverage of Frictional Q-Learning — every cluster mentioning Frictional Q-Learning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_22080 ·

    Frictional Q-Learning 算法增强了强化学习的稳定性和性能

    研究人员推出了一种新颖的离策略强化学习算法 Frictional Q-Learning,旨在解决外插误差问题。该方法通过类比静摩擦,将回放缓冲区建模为低维流形,并将支持的操作识别为切线方向。这种方法使用对比变分自编码器对支持的操作进行编码,与现有方法相比,在连续控制基准测试中表现出更稳定、更鲁棒的性能。