DVGT-2 model advances autonomous driving with real-time geometry and planning

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-27 04:00

Researchers have introduced DVGT-2, a novel Vision-Geometry-Action (VGA) model designed for autonomous driving. Unlike previous vision-language-action models, DVGT-2 prioritizes dense 3D geometry for decision-making. The model processes inputs in real-time using temporal causal attention and historical feature caching, enabling efficient online inference for both geometry reconstruction and trajectory planning. AI

影响 Introduces a new paradigm for autonomous driving that prioritizes 3D geometry, potentially improving planning accuracy and efficiency.

排序理由 This is a research paper detailing a new model for autonomous driving.

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Sicheng Zuo, Zixun Xie, Wenzhao Zheng, Shaoqing Xu, Fang Li, Hanbing Li, Long Chen, Zhi-Xin Yang, Jiwen Lu · 2026-04-27 04:00

DVGT-2: Vision-Geometry-Action Model for Autonomous Driving at Scale

arXiv:2604.00813v3 Announce Type: replace Abstract: End-to-end autonomous driving has evolved from the conventional paradigm based on sparse perception into vision-language-action (VLA) models, which focus on learning language descriptions as an auxiliary task to facilitate plann…

报道来源 [1]

DVGT-2: Vision-Geometry-Action Model for Autonomous Driving at Scale

相关实体

相关话题