English(EN) PARSE: Part-Aware Relational Spatial Modeling

新的PARSE框架对物体部件进行建模，以实现逼真的3D场景生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 04:00

研究人员推出PARSE，一个旨在通过对物体部件级别的交互进行建模来提高AI空间智能的新型框架。该方法利用部件中心装配图（PAG）来编码物体部件之间的几何关系，从而能够创建物理上一致且无碰撞的3D场景。为此开发了一个新的数据集PARSE-10K，包含10,000个具有详细部件级别标注的3D室内场景，用于训练和评估该框架。在Qwen3-VL模型上对该数据集进行微调，证明了其物体级别布局推理和部件级别关系理解能力的增强，而将其集成到3D生成模型中则产生了物理真实感更强的场景。 AI

影响增强了AI生成物理上逼真的3D场景和理解空间关系的能力。

排序理由该集群包含一篇详细介绍新的空间推理框架和数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Yinuo Bai, Peijun Xu, Kuixiang Shao, Yuyang Jiao, Jingxuan Zhang, Kaixin Yao, Jiayuan Gu, Jingyi Yu · 2026-06-08 04:00

PARSE：部件感知关系空间建模

arXiv:2603.07704v2 Announce Type: replace Abstract: Inter-object relations underpin spatial intelligence, yet existing representations -- linguistic prepositions or object-level scene graphs -- are too coarse to specify which regions actually support, contain, or contact one anot…

报道来源 [1]

PARSE：部件感知关系空间建模

相关实体

相关话题