PulseAugur
实时 19:35:04
实体 Gianluca Sabatini

Gianluca Sabatini

PulseAugur coverage of Gianluca Sabatini — every cluster mentioning Gianluca Sabatini across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_51004 ·

    改进的软Actor-Critic算法在机器人运动方面达到PPO性能水平

    研究人员开发了一种改进版的软Actor-Critic (SAC)算法,该算法在训练腿式机器人方面达到了与Proximal Policy Optimization (PPO)算法相媲美的性能。这种新方法通过允许SAC重用过去的经验来解决其样本效率低的问题,使其适用于模拟到现实的迁移以及在物理硬件上进行在线学习。这些改进包括策略初始化、Critic目标和回报估计方面的优化,使得SAC能够在各种机器人平台和运动任务上稳定地进行大规模训练。