PulseAugur
实时 09:17:56

FUSER transformer 在扩散精炼下实现了高效的多视图 3D 配准

研究人员推出了一种新颖的前馈 Transformer 模型 FUSER,用于多视图 3D 配准。该模型在潜在空间中同时处理所有扫描,直接预测全局姿态,无需进行计算密集型的成对匹配。FUSER 使用稀疏 3D CNN 对扫描进行编码,并使用几何交替注意力模块进行高效推理,同时整合了来自基础模型的 2D 注意力先验。此外,FUSER-DF,一个扩散精炼框架,通过在联合 SE(3)$^N$ 空间中对估计值进行去噪,进一步提高了配准精度。 AI

影响 引入了一种新颖的 3D 配准 Transformer 架构,有望提高机器人和增强现实等应用的效率和准确性。

排序理由 这是一篇介绍 3D 配准新方法的论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

FUSER transformer 在扩散精炼下实现了高效的多视图 3D 配准

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Haobo Jiang, Jin Xie, Jian Yang, Liang Yu, Jianmin Zheng ·

    FUSER: Feed-Forward MUltiview 3D Registration Transformer and SE(3)$^N$ Diffusion Refinement

    arXiv:2512.09373v2 Announce Type: replace Abstract: Registration of multiview point clouds conventionally relies on extensive pairwise matching to build a pose graph for global synchronization, which is computationally expensive and inherently ill-posed without holistic geometric…