研究人员推出LithoBench,一个旨在评估大型多模态模型从遥感数据解释地质岩性能力的新基准。该基准包含10,000个专家标注的实例,涵盖12种岩性类别,并分为五个认知级别,从基本识别到复杂推理。使用LithoBench进行的实验揭示了当前大型多模态模型存在的显著局限性,特别是在执行更高级别的地质解释、应用和推理任务方面。 AI
影响 该基准将帮助研究人员识别并解决大型多模态模型在诸如地质学等专业领域的不足之处。
排序理由 该集群包含一篇介绍用于评估AI模型的新型基准的新学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →