PulseAugur
实时 10:10:46
实体 Jashaswimalya Acharjee

Jashaswimalya Acharjee

PulseAugur coverage of Jashaswimalya Acharjee — every cluster mentioning Jashaswimalya Acharjee across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70232 ·

    新的强化学习算法将无模型效率与基于模型的表示相结合

    一篇研究论文介绍了一种名为统一潜在动力学(ULD)的新型强化学习算法,旨在结合无模型方法的效率和基于模型方法的表示能力。ULD通过将状态-动作对嵌入到一个潜在空间中来实现这一点,在该空间中,价值函数近似线性,从而避免了规划的计算开销。该算法在连续控制和Atari游戏等各种领域都表现出强大的性能,以更少的参数和最少的调整匹配或超越了专门的基线。