研究人员推出了一种新颖的用于自动驾驶的体积世界模型 CascadeOcc,该模型强调内在结构层次。该模型在自回归框架内集成了级联矢量量化(VQ)机制,以逐步完善从全局结构到细节的表示。通过引入 TimeMixer 来处理时间依赖性,CascadeOcc 在空间和时间上建立了双重层次结构,在以视觉为中心的方法中,在 4D 体积预测和运动规划方面表现出卓越的性能。 AI
影响 优化了自动驾驶的内在表示,为大型基础模型提供了以视觉为中心的选择。
排序理由 该集群描述了一篇在 arXiv 上发表的新研究论文,其中详细介绍了一种新的模型架构。
- alphaXiv
- arXiv
- CascadeOcc
- CatalyzeX
- DagsHub
- Gotit.pub
- Hugging Face
- ScienceCast
- TimeMixer
- Vector Quantized (VQ)
- CORE Recommender
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →