PulseAugur
实时 13:43:39
实体 SeedRL

SeedRL

PulseAugur coverage of SeedRL — every cluster mentioning SeedRL across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_111264 ·

    新研究重新审视复杂强化学习空间中的动作分解 · 跟踪到2个来源

    一篇新的研究论文探讨了在强化学习中处理复杂动作空间的方法,特别是那些结合了离散动作和连续动作的动作空间。该研究分析了不同算法和环境中的各种分解技术,并引入了两个新的并行环境 CoopPush 和 Hybrid-Shoot 来促进这项研究。研究结果表明,分支对决架构在计算和性能之间取得了良好的平衡,而自回归动作(Auto-Regressive actions)取得了最高的整体性能,尽管原生连续 SAC 尽管计算成本更高,但表现更优。