PulseAugur
实时 11:36:18

Valdi: 用于快速MPC的扩散世界模型

研究人员开发了Valdi,一种用于模型预测控制(MPC)的世界模型的新方法,该方法将潜在扩散动力学模型与端到端在线训练相结合。该方法旨在通过使用扩散模型来解决MPC所需的快速和富有表现力的动力学预测的挑战,而扩散模型通常在实时规划方面速度较慢。在CarRacing环境上的初步实验表明,Valdi通过单次扩散步骤即可达到与确定性MLP基线相当的性能,尽管它突显了预测多模态性与控制性能之间的权衡。 AI

影响 通过提高世界模型在控制方面的效率,这项研究可以为自主系统实现更快、更鲁棒的决策。

排序理由 该集群包含一篇详细介绍AI世界模型新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →

Valdi: 用于快速MPC的扩散世界模型

报道来源 [3]

  1. arXiv cs.AI TIER_1 (ET) · Christopher Lindenberg, Kashyap Chitta ·

    Valdi: Value Diffusion World Models

    arXiv:2607.00917v1 Announce Type: cross Abstract: World models can enable Model Predictive Control (MPC), but this requires dynamics prediction that is both fast enough for online use and expressive enough to represent uncertain futures. Diffusion models offer a natural mechanism…

  2. arXiv cs.AI TIER_1 (ET) · Kashyap Chitta ·

    Valdi:价值扩散世界模型

    World models can enable Model Predictive Control (MPC), but this requires dynamics prediction that is both fast enough for online use and expressive enough to represent uncertain futures. Diffusion models offer a natural mechanism for modeling uncertain dynamics, yet their iterat…

  3. Hugging Face Daily Papers TIER_1 (ET) ·

    Valdi: Value Diffusion World Models

    Value Diffusion World Models combine end-to-end online training with latent diffusion dynamics to enable fast, uncertain dynamics prediction for Model Predictive Control in reinforcement learning environments.