PulseAugur
实时 14:54:40
English(EN) Pose Anything Anywhere:Model-free Object Poses from Arbitrary References

新的 PANY 框架实现了最先进的物体姿态估计

研究人员开发了 PANY,一个新颖的无模型框架,用于估计未知物体的 6D 姿态,专为开放世界机器人和具身感知而设计。与之前仅限于成对匹配的方法不同,PANY 利用多视图 Transformer 几何骨干来学习视图一致的几何和跨视图对齐线索,即使在查询-参考重叠有限和遮挡的情况下也能实现稳健的性能。该框架支持 RGB 和 RGB-D 输入,并可以利用稀疏参考视图或额外的未姿态辅助视图来提高几何覆盖率和姿态准确性。实验表明,PANY 在 YCB-VLM-O 等基准测试中取得了最先进的结果,显著优于现有的无模型方法。 AI

影响 这个新框架通过在复杂环境中实现更鲁棒的物体识别和操作,可以显著推进机器人和具身感知技术。

排序理由 该项目是一篇学术论文,详细介绍了一种新的物体姿态估计方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的 PANY 框架实现了最先进的物体姿态估计

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Slobodan Ilic ·

    Pose Anything Anywhere:Model-free Object Poses from Arbitrary References

    Estimating the 6D pose of unseen objects is a fundamental yet challenging problem for open-world robotics and embodied perception. Model-based methods are accurate but depend on CAD assets or heavy onboarding, while most model-free approaches are still limited to pairwise single-…