ELVIS: Ensemble-Calibrated Latent Imagination for Long-Horizon Visual MPC

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-05 04:00

研究人员开发了ELVIS，一种用于强化学习中长时域视觉规划的新方法，该方法使用高斯混合模型预测控制器在扩展的rollout中维护多个假设。该方法在一个新论文中进行了详细介绍，还包含了一个不确定性感知的回报机制来稳定想象并限制复合误差。ELVIS在视觉控制任务上展示了最先进的性能，并有望在有遮挡的现实世界应用中发挥作用。另外，另一篇论文介绍了TRAP，一种通过操纵想象轨迹的排名来针对世界模型的后门攻击，该攻击已被证明会降低DreamerV3和TD-MPC2等代理的性能。 AI

影响长时域规划的新方法和对世界模型的安全评估可以提升代理能力和安全性。

排序理由两篇新的arXiv论文详细介绍了强化学习规划的进展，并引入了一种针对世界模型的新型攻击向量。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

ELVIS: Ensemble-Calibrated Latent Imagination for Long-Horizon Visual MPC

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Yurui Du, Pinhao Song, Yutong Hu, Renaud Detry · 2026-05-07 04:00

ELVIS: Ensemble-Calibrated Latent Imagination for Long-Horizon Visual MPC

arXiv:2605.04709v1 Announce Type: new Abstract: A central challenge of visual control with model-based reinforcement learning (RL) is reliable long-horizon planning: long rollouts with learned latent dynamics exhibit branching futures and multi-modal action-value distributions. I…
arXiv cs.LG TIER_1 English(EN) · Siyuan Duan, Ke Zhang, Xizhao Luo · 2026-05-05 04:00

TRAP：面向世界模型规划的尾部感知排序攻击

arXiv:2605.01950v1 Announce Type: new Abstract: World models enable long-horizon planning by internally generating and evaluating imagined trajectories, making them a promising foundation for generalist agents. However, this imagination-driven decision process also introduces new…

报道来源 [2]

ELVIS: Ensemble-Calibrated Latent Imagination for Long-Horizon Visual MPC

TRAP：面向世界模型规划的尾部感知排序攻击

相关实体

相关话题