研究人员开发了MSEarth,这是一个新的多模态基准测试,旨在评估多模态大语言模型(MLLMs)在地球科学推理方面的能力。该数据集包含超过289,000张带有详细说明和上下文讨论的图表,这些图表来自五大地球科学领域开放获取的科学出版物。MSEarth支持图表说明、选择题和开放式推理等任务,旨在为推进MLLMs在科学发现中的应用提供一个高保真度的资源。 AI
影响 为多模态大语言模型在科学推理方面建立了一个新的基准测试,有可能加速人工智能在地球科学研究中的应用。
排序理由 这是一篇介绍用于评估多模态大语言模型在地球科学领域能力的新基准数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →