实体
Lapito
Lapito
PulseAugur coverage of Lapito — every cluster mentioning Lapito across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新研究详细介绍了逆动力学模型在模仿学习中的样本效率
一篇新的研究论文探讨了逆动力学模型(IDMs)在半监督模仿学习中的样本效率。研究表明,在一种称为基于IDM策略的极限情况下,VM-IDM和IDM标注方法学习到了相同的策略。研究人员将基于IDM策略的优越样本效率归因于其比专家策略更低的复杂度假设类和更低的随机性,这得到了统计学习理论以及在Procgen和LIBERO等基准测试上的实验支持。该论文还介绍了一种改进的用于潜在动作策略学习的LAPO算法。
-
新MaskLAM方法增强具身智能体训练
研究人员开发了一种名为MaskLAM的新方法,用于改进使用潜在动作模型(latent action models)的具身智能体(embodied agents)的训练。该技术解决了视频中与动作相关的视觉干扰物问题,这些干扰物可能导致模型学习不相关的运动,而不是智能体控制的动力学。MaskLAM通过将重建目标仅集中在属于智能体的像素上,有效地迫使潜在动作代表智能体的实际运动。这种方法在预训练期间不需要架构更改或额外的标签,并在基准任务上…