PulseAugur
实时 21:49:53
English(EN) OccDirector: Language-Guided Behavior and Interaction Generation in 4D Occupancy Space

OccDirector: 语言引导的4D占用空间中的行为与交互生成

研究人员推出OccDirector,一个新框架,旨在仅凭自然语言指令生成自动驾驶模拟中复杂的4D占用动态。该系统充当“场景导演”,将文本脚本转换为物理上可行的体素运动,而无需预定义的几何条件。OccDirector利用VLM驱动的时空MMDiT和历史前缀锚定策略来维持长期交互的一致性。配套的OccInteract-85k数据集和基于VLM的评估基准促进了此类语言驱动行为编排的训练和评估。 AI

影响 为自动驾驶研究提供了更复杂、语言控制的模拟环境。

排序理由 该集群描述了一篇关于用于AI驱动模拟的新颖框架和数据集的详细研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

OccDirector: 语言引导的4D占用空间中的行为与交互生成

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Zhuding Liang, Tianyi Yan, Dubing Chen, Jiasen Zheng, Huan Zheng, Cheng-zhong Xu, Yida Wang, Kun Zhan, Jianbing Shen ·

    OccDirector: Language-Guided Behavior and Interaction Generation in 4D Occupancy Space

    arXiv:2604.22240v1 Announce Type: new Abstract: Generative world models increasingly rely on 4D occupancy for realistic autonomous driving simulation. However, existing generation frameworks depend on rigid geometric conditions (e.g., explicit trajectories) or simplistic attribut…

  2. arXiv cs.CV TIER_1 English(EN) · Jianbing Shen ·

    OccDirector: Language-Guided Behavior and Interaction Generation in 4D Occupancy Space

    Generative world models increasingly rely on 4D occupancy for realistic autonomous driving simulation. However, existing generation frameworks depend on rigid geometric conditions (e.g., explicit trajectories) or simplistic attribute-level text, failing to orchestrate complex, se…