PulseAugur
实时 10:54:29
English(EN) Geospatial-Temporal Sensemaking of Remote Sensing Activity Detections with Multimodal Large Language Model

新的MLLM框架分析遥感数据以检测建筑工地活动

研究人员开发了一个新的多模态大语言模型(MLLM)框架,用于分析遥感数据,特别是针对建筑工地。该框架利用Sentinel-2卫星图像数据集,并将现有标注转换为自然语言问答对,以进行时空分析。该系统在超过21,000个图像芯片和数百万个时间比较示例的数据集上进行训练,旨在实现对正在进行的建筑过程及其随时间演变的推理。 AI

影响 通过卫星图像和自然语言查询,能够对建筑工地演变进行更复杂的分析。

排序理由 发布了一篇学术论文,详细介绍了一个用于遥感分析的新数据集和模型框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的MLLM框架分析遥感数据以检测建筑工地活动

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Andreas Spanias ·

    Geospatial-Temporal Sensemaking of Remote Sensing Activity Detections with Multimodal Large Language Model

    We introduce SMART-HC-VQA, a Sentinel-2-based visual question answering dataset derived from the IARPA SMART Heavy Construction dataset, designed for spatiotemporal analysis of human activity. The dataset transforms construction-site annotations, construction-type labels, tempora…