PulseAugur
实时 11:37:48
实体 Reward Redesign

Reward Redesign

PulseAugur coverage of Reward Redesign — every cluster mentioning Reward Redesign across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_72420 ·

    机器人研究人员通过迁移学习增强运动规划

    研究人员开发了一个新框架 iCEM+TL,以提高机器人操作任务的低级运动规划效率。该方法结合了样本高效交叉熵方法 (iCEM) 和迁移学习 (TL),将参数从简单任务转移到更复杂的任务。该框架还通过任务分解来整合奖励重塑 (RR),以实现堆叠和货架放置等特定动作。模拟显示成功率提高了 23%,并且该方法已在真实的 Franka Emika 机器人上成功演示。