Gaga 框架使用 3D 内存库进行场景分割

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-29 04:00

研究人员开发了 Gaga，一个使用来自零样本分割模型的非一致性 2D 掩码来重建和分割 3D 场景的新框架。与依赖对象跟踪或对比学习的先前方法不同，Gaga 采用了一个 3D 感知内存库来关联不同相机姿态下的对象掩码，使其能够应对稀疏图像采样和不一致的视图变化。该框架的多功能性通过其能够适应来自不同分割模型的掩码而得到进一步增强，在 3D 场景理解等实际应用中表现出强大的性能。 AI

影响引入了一种新的 3D 场景理解方法，该方法对不一致的数据和不同的分割模型具有鲁棒性。

排序理由这是一篇描述用于 3D 场景重建和分割的新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Weijie Lyu, Xueting Li, Abhijit Kundu, Yi-Hsuan Tsai, Ming-Hsuan Yang · 2026-05-29 04:00

Gaga: Group Any Gaussians via 3D-aware Memory Bank

arXiv:2404.07977v4 Announce Type: replace Abstract: We introduce Gaga, a framework that reconstructs and segments open-world 3D scenes by leveraging inconsistent 2D masks predicted by zero-shot class-agnostic segmentation models. Contrasted to prior 3D scene segmentation approach…

报道来源 [1]

Gaga: Group Any Gaussians via 3D-aware Memory Bank

相关实体

相关话题