新AI框架规划3D故事世界中的摄像机移动

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-25 12:38

研究人员推出了一种名为“Look-Before-Move”的新型摄像机规划框架，专为动态3D故事世界设计。该系统使具身AI能够在执行摄像机运动之前主动决定获取哪些视觉信息，从而超越了被动观察。该框架将观察规范与运动执行分开，利用语义观察契约（Semantic Observation Contract）和蒙特卡洛视点搜索（Monte Carlo Viewpoint Search）来寻找符合要求的视点，然后将这些视点落实到平滑、避碰的轨迹中。还创建了一个基于StoryBlender的新基准来评估这种方法在复杂叙事环境中的表现。 AI

影响这项研究可以增强具身AI代理在复杂动态环境中的能力，从而实现更复杂的虚拟叙事和模拟。

排序理由该集群包含一篇详细介绍新AI框架和基准的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Jiaming Bian, Bingliang Li, Yuehao Wu, Pichao Wang, Zhi Wang, Hailan Ma, Huadong Mo, Zhenhong Sun · 2026-06-26 04:00

Look-Before-Move: Narrative-Grounded World Visual Attention in Dynamic 3D Story Worlds

arXiv:2606.26964v1 Announce Type: new Abstract: As embodied AI and world models increasingly operate in dynamic 3D environments, visual perception must move beyond passively interpreting given observations toward actively deciding what to observe. We study this problem through ca…
arXiv cs.CV TIER_1 English(EN) · Zhenhong Sun · 2026-06-25 12:38

三思而后行：动态3D故事世界中的叙事驱动世界视觉注意力

As embodied AI and world models increasingly operate in dynamic 3D environments, visual perception must move beyond passively interpreting given observations toward actively deciding what to observe. We study this problem through camera planning in dynamic 3D story worlds, where …

报道来源 [2]

Look-Before-Move: Narrative-Grounded World Visual Attention in Dynamic 3D Story Worlds

三思而后行：动态3D故事世界中的叙事驱动世界视觉注意力

相关实体

相关话题