研究人员推出OccDirector,一个新框架,旨在仅凭自然语言指令生成自动驾驶模拟中复杂的4D占用动态。该系统充当“场景导演”,将文本脚本转换为物理上可行的体素运动,而无需预定义的几何条件。OccDirector利用VLM驱动的时空MMDiT和历史前缀锚定策略来维持长期交互的一致性。配套的OccInteract-85k数据集和基于VLM的评估基准促进了此类语言驱动行为编排的训练和评估。 AI
影响 为自动驾驶研究提供了更复杂、语言控制的模拟环境。
排序理由 该集群描述了一篇关于用于AI驱动模拟的新颖框架和数据集的详细研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →