PulseAugur
实时 20:19:13
实体 Flow-Anchored Noise-conditioned Q-Learning

Flow-Anchored Noise-conditioned Q-Learning

PulseAugur coverage of Flow-Anchored Noise-conditioned Q-Learning — every cluster mentioning Flow-Anchored Noise-conditioned Q-Learning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_16061 ·

    新的FAN算法提升离线强化学习的效率和性能

    研究人员开发了一种新的离线强化学习算法,称为基于流锚定的噪声条件Q学习(FAN)。该方法旨在通过简化流策略和分布批评者的计算需求来提高离线强化学习的效率和性能。FAN采用单一的流策略迭代和单一的高斯噪声样本,理论分析和机器人任务实验表明,这可以带来更好的性能并缩短训练和推理时间。