研究人员开发了一个名为变换感知解耦(TAD)的新框架,以改进三维场景图生成(3DSGG)模型。当前模型在处理视点变化时存在困难,会错误地转换“左”或“右”等方向性谓词,同时未能稳定“站立在”等谓词。TAD通过将关系推理分为两部分来解决这个问题:一部分学习视点稳定的线索,另一部分学习随观察帧变化的定向线索。这种方法在训练时无需旋转增强即可提高对视点偏移的鲁棒性,同时在标准基准测试中保持了有竞争力的性能。 AI
影响 通过提高三维场景图生成中的视点鲁棒性,增强了具身AI的空间理解能力。
排序理由 详细介绍三维场景图生成新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →