PulseAugur
实时 04:48:08
实体 Raj Ghugare

Raj Ghugare

PulseAugur coverage of Raj Ghugare — every cluster mentioning Raj Ghugare across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_111774 ·

    正态流被证明是强化学习中连续控制的强大模型

    研究人员已经证明,正态流(NF)是强化学习(RL)中连续控制任务的强大模型。与普遍认为NF缺乏足够表现力的观点相反,本文提出了一种单一的NF架构,可以无缝集成到RL算法中,用于策略、Q函数和占用测度等各种功能。这种集成简化了RL算法,并在模仿学习、离线RL、目标条件RL和无监督RL中取得了优越的性能。