English(EN) EA-WM: Event-Aware Generative World Model with Structured Kinematic-to-Visual Action Fields

EA-WM模型通过动作引导的视频合成增强机器人世界模型

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-07 13:06

研究人员开发了EA-WM，一种新颖的生成式世界模型，专为机器人技术设计，可改善动作信号在视频合成中的集成。与以往将视频生成视为策略学习次要任务的模型不同，EA-WM直接将动作和运动学状态投影到视觉域，形成结构化运动学到视觉动作场。这种方法增强了机器人空间几何和物体交互动力学的保留。在WorldArena基准测试上进行评估，EA-WM展示了最先进的性能。 AI

影响该模型可以通过更好地将视觉生成与物理动作联系起来，从而改进机器人控制和模拟。

排序理由这是一篇详细介绍新模型和基准性能的研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Zhaoyang Yang, Yurun Jin, Lizhe Qi, Cong Huang, Kai Chen · 2026-05-08 04:00

EA-WM: Event-Aware Generative World Model with Structured Kinematic-to-Visual Action Fields

arXiv:2605.06192v1 Announce Type: new Abstract: Pretrained video diffusion models provide powerful spatiotemporal generative priors, making them a natural foundation for robotic world models. While recent world-action models jointly optimize future videos and actions, they predom…
arXiv cs.CV TIER_1 English(EN) · Kai Chen · 2026-05-07 13:06

EA-WM: Event-Aware Generative World Model with Structured Kinematic-to-Visual Action Fields

Pretrained video diffusion models provide powerful spatiotemporal generative priors, making them a natural foundation for robotic world models. While recent world-action models jointly optimize future videos and actions, they predominantly treat video generation as an auxiliary r…

报道来源 [2]

EA-WM: Event-Aware Generative World Model with Structured Kinematic-to-Visual Action Fields

EA-WM: Event-Aware Generative World Model with Structured Kinematic-to-Visual Action Fields

相关实体

相关话题