PulseAugur
实时 14:03:35
English(EN) ReScene: Structured Indoor Scene Reconstruction from Multi-View Captures

ReScene框架以更高精度重建3D室内场景 · arXiv论文

研究人员开发了ReScene,一个旨在从多视图捕获中构建可用于仿真的3D室内场景的新框架。该方法通过专注于跨视图关系融合和物理上合理的场景组装,而不是仅仅进行单对象重建,来解决现有方法的局限性。ReScene利用HierView组件来优先化重建视图,并使用Relation-Aware Assembly将多帧预测与几何先验相结合,从而生成一个置信度加权的场景图。该框架在ScanNet场景上实现了最先进的性能,显著降低了Chamfer Distance和LPIPS指标,同时运行速度比以前的多视图技术更快。此外,ReScene能够创建一个新的具身视觉问答数据集,其中经过微调的Qwen-VL模型展示了强大的空间推理能力。 AI

影响 增强了为具身AI研究和应用创建逼真3D环境的能力。

排序理由 该集群包含一篇详细介绍新型3D场景重建框架的arXiv论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

ReScene框架以更高精度重建3D室内场景 · arXiv论文

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Haoran Xu, Lechao Zhang, Daoguo Dong, Yan Gao, Xin Tan ·

    ReScene: Structured Indoor Scene Reconstruction from Multi-View Captures

    arXiv:2606.28060v1 Announce Type: new Abstract: Constructing simulation-ready 3D scenes from multi-view captures is a key bottleneck for Embodied Artificial Intelligence, as downstream tasks require object-level structure, explicit inter-object relations, and physical plausibilit…

  2. arXiv cs.CV TIER_1 English(EN) · Xin Tan ·

    ReScene:多视图捕获的结构化室内场景重建

    Constructing simulation-ready 3D scenes from multi-view captures is a key bottleneck for Embodied Artificial Intelligence, as downstream tasks require object-level structure, explicit inter-object relations, and physical plausibility. Existing approaches either rely on specialize…