研究人员开发了 PANY,一个新颖的无模型框架,用于估计未知物体的 6D 姿态,专为开放世界机器人和具身感知而设计。与之前仅限于成对匹配的方法不同,PANY 利用多视图 Transformer 几何骨干来学习视图一致的几何和跨视图对齐线索,即使在查询-参考重叠有限和遮挡的情况下也能实现稳健的性能。该框架支持 RGB 和 RGB-D 输入,并可以利用稀疏参考视图或额外的未姿态辅助视图来提高几何覆盖率和姿态准确性。实验表明,PANY 在 YCB-V 和 LM-O 等基准测试中取得了最先进的结果,显著优于现有的无模型方法。 AI
影响 这个新框架通过在复杂环境中实现更鲁棒的物体识别和操作,可以显著推进机器人和具身感知技术。
排序理由 该项目是一篇学术论文,详细介绍了一种新的物体姿态估计方法。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- Connected Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- Litmaps
- ScienceCast
- scite Smart Citations
- YCB-V
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →