新的MMLandmarks数据集支持多模态地理空间理解

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-29 04:00

研究人员推出MMLandmarks，一个旨在通过整合多种数据模态来推进地理空间理解的新基准数据集。该数据集包含美国18,000多个地标的航拍和地面视图图像、文本描述以及地理坐标。MMLandmarks支持跨视图检索和地理定位等任务的模型训练和评估，突显了当前模型利用多样化地理空间信息的能力差距。 AI

影响新的多模态数据集可能实现更广泛的地理空间理解和相关AI任务的性能提升。

排序理由该集群包含一篇介绍新基准数据集的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Oskar Kristoffersen, Alba Reinders S\'anchez, Morten Rieger Hannemose, Anders Bjorholm Dahl, Dim P. Papadopoulos · 2026-04-29 04:00

MMLANDMARKS：一个用于地理空间理解的跨视图实例级基准

arXiv:2512.17492v2 Announce Type: replace Abstract: Geo-spatial analysis of our world benefits from a multimodal approach, as every single geographic location can be described in numerous ways (images from various viewpoints, textual descriptions, geographic coordinates, etc.). C…

报道来源 [1]

MMLANDMARKS：一个用于地理空间理解的跨视图实例级基准

相关实体

相关话题