English(EN) HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

HERMES++模型统一3D场景理解与未来几何预测，助力自动驾驶

作者 PulseAugur 编辑部 · [2 个来源] · 2026-04-30 17:59

研究人员推出HERMES++，这是一种新颖的统一驾驶世界模型，旨在增强自动驾驶系统的3D场景理解和未来几何预测能力。该模型利用鸟瞰图（BEV）表示和LLM增强查询，将语义解释与物理模拟相结合。HERMES++弥合了当前状态与未来状态之间的时间差距，并通过联合几何优化确保结构完整性。该方法在多个基准测试中表现出色，在预测和理解任务上均优于专用方法。 AI

影响推动自动驾驶领域统一的3D场景理解和几何预测，有望提高模拟的准确性和安全性。

排序理由该集群描述了一篇关于自动驾驶新颖模型的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Xin Zhou, Dingkang Liang, Xiwu Chen, Feiyang Tan, Dingyuan Zhang, Hengshuang Zhao, Xiang Bai · 2026-05-01 04:00

HERMES++：迈向统一的驾驶世界模型，用于3D场景理解与生成

arXiv:2604.28196v1 Announce Type: new Abstract: Driving world models serve as a pivotal technology for autonomous driving by simulating environmental dynamics. However, existing approaches predominantly focus on future scene generation, often overlooking comprehensive 3D scene un…
arXiv cs.CV TIER_1 English(EN) · Xiang Bai · 2026-04-30 17:59

HERMES++：迈向统一的驾驶世界模型，用于3D场景理解与生成

Driving world models serve as a pivotal technology for autonomous driving by simulating environmental dynamics. However, existing approaches predominantly focus on future scene generation, often overlooking comprehensive 3D scene understanding. Conversely, while Large Language Mo…

报道来源 [2]

HERMES++：迈向统一的驾驶世界模型，用于3D场景理解与生成

HERMES++：迈向统一的驾驶世界模型，用于3D场景理解与生成

相关实体

相关话题