研究人员开发了CIPER,一个统一地理定位的跨视图图像检索和姿态估计的新框架。与之前将这些视为独立任务的方法不同,CIPER的单一架构通过学习互惠特征来联合执行这两项任务。该系统利用共享的Transformer编码器和特定任务的token来区分检索和定位线索,并通过双向Transformer姿态解码器解决地面和航空影像之间的域差距。在基准数据集上的实验表明,该系统具有竞争力,尤其是在视场有限和任意方向等挑战性条件下。 AI
影响 引入了一种统一的跨视图地理定位方法,有望提高自动驾驶和地图绘制等应用的准确性和效率。
排序理由 详细介绍计算机视觉任务新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →