PulseAugur
实时 08:13:00

LA-Pose 使用潜在动作预训练进行高效相机位姿估计

研究人员推出了一种新颖的相机位姿估计方法 LA-Pose,该方法利用了自监督预训练。该方法使用逆动力学模型从大规模驾驶视频中学习潜在动作表示,然后将其重新用于位姿估计。与现有方法相比,LA-PoseWaymoPandaSet 等驾驶基准测试中表现更优,准确率提高了 10% 以上,同时所需的标注数据量大大减少。 AI

影响 该方法可能会减少位姿估计任务中对大量 3D 注释的需求,从而可能加速自动驾驶等领域的发展。

排序理由 这是一篇介绍位姿估计新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

LA-Pose 使用潜在动作预训练进行高效相机位姿估计

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Zhengqing Wang, Saurabh Nair, Prajwal Chidananda, Pujith Kachana, Samuel Li, Matthew Brown, Yasutaka Furukawa ·

    LA-Pose: Latent Action Pretraining Meets Pose Estimation

    arXiv:2604.27448v1 Announce Type: new Abstract: This paper revisits camera pose estimation through the lens of self-supervised pretraining, focusing on inverse-dynamics pretraining as a scalable alternative to the current trend of fully supervised training with 3D annotations. Co…

  2. arXiv cs.CV TIER_1 English(EN) · Yasutaka Furukawa ·

    LA-Pose: Latent Action Pretraining Meets Pose Estimation

    This paper revisits camera pose estimation through the lens of self-supervised pretraining, focusing on inverse-dynamics pretraining as a scalable alternative to the current trend of fully supervised training with 3D annotations. Concretely, we employ inverse- and forward-dynamic…