研究人员推出了EO-Gym,这是一个专为地球观测(EO)代理设计的交互式框架。该环境支持多模态分析和工具使用,模拟现实世界中经常涉及扩展感兴趣区域和检索不同传感器历史数据的EO任务。创建了一个包含超过9000个轨迹的基准数据集EO-Gym-Data来评估代理性能,结果显示当前的大型视觉语言模型在交互式EO推理方面存在困难。在EO-Gym-Data上微调Qwen模型显著提高了其在这些任务上的性能。 AI
影响 为开发和评估地球观测任务中的AI代理引入了新的基准和框架,有望提高分析能力。
排序理由 这是一篇介绍AI代理新基准和框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →