English(EN) CityRAG: Stepping Into a City via Spatially-Grounded Video Generation

CityRAG模型从地理注册数据生成可导航的3D环境

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 04:00

研究人员开发了CityRAG，这是一种新颖的视频生成模型，能够创建基于真实世界地理的可导航、3D一致性环境。该模型可以生成长视频序列，即使在时间上不对齐的训练数据下也能保持一致的天气和光照条件。CityRAG将场景结构与瞬态属性解耦的能力使其在自动驾驶和机器人模拟中具有应用前景。 AI

影响能够为训练自主系统创建逼真、可导航的3D环境。

排序理由该集群包含一篇详细介绍新模型的论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Gene Chou, Charles Herrmann, Kyle Genova, Boyang Deng, Songyou Peng, Bharath Hariharan, Jason Y. Zhang, Noah Snavely, Philipp Henzler · 2026-06-05 04:00

CityRAG：通过空间定位视频生成步入城市

arXiv:2604.19741v2 Announce Type: replace Abstract: We address the problem of generating a 3D-consistent, navigable environment that is spatially grounded: a simulation of a real location. Existing video generative models can produce a plausible sequence that is consistent with a…