实体 Reward Redesign

Reward Redesign

PulseAugur coverage of Reward Redesign — every cluster mentioning Reward Redesign across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_72420 · Jun 4 · 11:34

机器人研究人员通过迁移学习增强运动规划

研究人员开发了一个新框架 iCEM+TL，以提高机器人操作任务的低级运动规划效率。该方法结合了样本高效交叉熵方法 (iCEM) 和迁移学习 (TL)，将参数从简单任务转移到更复杂的任务。该框架还通过任务分解来整合奖励重塑 (RR)，以实现堆叠和货架放置等特定动作。模拟显示成功率提高了 23%，并且该方法已在真实的 Franka Emika 机器人上成功演示。