实体 HalfCheetah-v5

HalfCheetah-v5

PulseAugur coverage of HalfCheetah-v5 — every cluster mentioning HalfCheetah-v5 across labs, papers, and developer communities, ranked by signal.

总计 · 30天

0

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 2

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_56198 · May 28 · 04:00

新框架可视化AI控制中的运动阶段

研究人员开发了一个新框架，用于可视化深度强化学习（DRL）运动控制策略中的潜在运动阶段结构。该方法将聚类特征从仅状态观测扩展到包括动作和下一个状态，并引入了一种在最小化自转换的同时确定最佳聚类数量的技术。当应用于Ant-v5、HalfCheetah-v5和Walker2D-v5等环境时，与现有方法相比，所提出的方法成功识别出更清晰、更规则的阶段结构。
TOOL · CL_50927 · May 26 · 04:00

通过丢弃冗余状态转移来稳定PPO训练

研究人员开发了一种通过从同策略（on-policy）的rollout中随机丢弃一部分转移来提高强化学习训练稳定性的方法。该技术应用于Proximal Policy Optimization (PPO)，打破了由因果链式状态引起的重复梯度结构。通过丢弃约25%的转移，该方法在保持奖励性能的同时，在各种指标上产生了更一致的训练动态。