PulseAugur
实时 21:59:30
English(EN) LithoBench: Benchmarking Large Multimodal Models for Remote-Sensing Lithology Interpretation

新的LithoBench基准揭示大型多模态模型的局限性

研究人员推出LithoBench,一个旨在评估大型多模态模型从遥感数据解释地质岩性能力的新基准。该基准包含10,000个专家标注的实例,涵盖12种岩性类别,并分为五个认知级别,从基本识别到复杂推理。使用LithoBench进行的实验揭示了当前大型多模态模型存在的显著局限性,特别是在执行更高级别的地质解释、应用和推理任务方面。 AI

影响 该基准将帮助研究人员识别并解决大型多模态模型在诸如地质学等专业领域的不足之处。

排序理由 该集群包含一篇介绍用于评估AI模型的新型基准的新学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的LithoBench基准揭示大型多模态模型的局限性

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Wei Han ·

    LithoBench: Benchmarking Large Multimodal Models for Remote-Sensing Lithology Interpretation

    Remote sensing lithology interpretation is fundamental to geological surveys, mineral exploration, and regional geological mapping. Unlike general land-cover recognition, lithology interpretation is a knowledge-intensive task that requires experts to infer rock types from various…