PulseAugur
实时 19:14:33
实体 Yifei Li

Yifei Li

PulseAugur coverage of Yifei Li — every cluster mentioning Yifei Li across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_18831 ·

    强化学习利用对称性和数据增强实现更快的飞机控制

    研究人员开发了一种新的离线强化学习方法,该方法利用动力学系统的对称性来提高样本效率。该方法使用对称数据增强来增强深度确定性策略梯度算法中的状态-动作空间覆盖率。具有一个在增强样本上训练的批评者的双批评者结构进一步提高了样本利用率,从而在模拟中实现了更快的策略收敛,尤其是在飞机姿态控制方面。