实体
Walker2d
Walker2d
PulseAugur coverage of Walker2d — every cluster mentioning Walker2d across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新研究重新审视复杂强化学习空间中的动作分解 · 跟踪到2个来源
一篇新的研究论文探讨了在强化学习中处理复杂动作空间的方法,特别是那些结合了离散动作和连续动作的动作空间。该研究分析了不同算法和环境中的各种分解技术,并引入了两个新的并行环境 CoopPush 和 Hybrid-Shoot 来促进这项研究。研究结果表明,分支对决架构在计算和性能之间取得了良好的平衡,而自回归动作(Auto-Regressive actions)取得了最高的整体性能,尽管原生连续 SAC 尽管计算成本更高,但表现更优。
-
新框架可视化AI控制中的运动阶段
研究人员开发了一个新框架,用于可视化深度强化学习(DRL)运动控制策略中的潜在运动阶段结构。该方法将聚类特征从仅状态观测扩展到包括动作和下一个状态,并引入了一种在最小化自转换的同时确定最佳聚类数量的技术。当应用于Ant-v5、HalfCheetah-v5和Walker2D-v5等环境时,与现有方法相比,所提出的方法成功识别出更清晰、更规则的阶段结构。