English(EN) Contrastive Language-Colored Pointmap Pretraining for Unified 3D Scene Understanding

3D场景理解模型UniScene3D发布后撤回

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-29 04:00

一篇题为“用于统一3D场景理解的对比语言着色点图预训练”的研究论文介绍了UniScene3D，这是一种基于Transformer的编码器，旨在从多视图彩色点图中学习统一的场景表示。该方法整合了图像外观和几何信息，采用了新颖的跨视图几何和基于地面的视图对齐来确保一致性。评估结果表明，在低样本和特定任务的微调方面，该模型在各种3D场景理解任务中均取得了最先进的性能，包括视点定位、场景检索、场景类型分类和3D视觉问答。然而，该论文后来被作者Ye Mao撤回。 AI

影响引入了一种新颖的3D场景理解方法，但由于撤回，其影响现在不确定。

排序理由关于新颖3D场景理解模型的研究论文，随后被作者撤回。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Ye Mao, Weixun Luo, Ranran Huang, Junpeng Jing, Krystian Mikolajczyk · 2026-06-29 04:00

Contrastive Language-Colored Pointmap Pretraining for Unified 3D Scene Understanding

arXiv:2604.02546v2 Announce Type: replace-cross Abstract: Pretraining 3D encoders by aligning with Contrastive Language Image Pretraining (CLIP) has emerged as a promising direction to learn generalizable representations for 3D scene understanding. In this paper, we propose UniSc…

报道来源 [1]

Contrastive Language-Colored Pointmap Pretraining for Unified 3D Scene Understanding

相关实体

相关话题