实体 Walker2d

Walker2d

PulseAugur coverage of Walker2d — every cluster mentioning Walker2d across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_111264 · Jun 25 · 03:48

新研究重新审视复杂强化学习空间中的动作分解 · 跟踪到2个来源

一篇新的研究论文探讨了在强化学习中处理复杂动作空间的方法，特别是那些结合了离散动作和连续动作的动作空间。该研究分析了不同算法和环境中的各种分解技术，并引入了两个新的并行环境 CoopPush 和 Hybrid-Shoot 来促进这项研究。研究结果表明，分支对决架构在计算和性能之间取得了良好的平衡，而自回归动作（Auto-Regressive actions）取得了最高的整体性能，尽管原生连续 SAC 尽管计算成本更高，但表现更优。
TOOL · CL_56198 · May 28 · 04:00

新框架可视化AI控制中的运动阶段

研究人员开发了一个新框架，用于可视化深度强化学习（DRL）运动控制策略中的潜在运动阶段结构。该方法将聚类特征从仅状态观测扩展到包括动作和下一个状态，并引入了一种在最小化自转换的同时确定最佳聚类数量的技术。当应用于Ant-v5、HalfCheetah-v5和Walker2D-v5等环境时，与现有方法相比，所提出的方法成功识别出更清晰、更规则的阶段结构。