PulseAugur
实时 06:52:30
English(EN) TerraBench: Can Agents Reason Over Heterogeneous Earth-System Data?

新基准TerraBench测试AI代理在地球系统数据推理能力

研究人员开发了TerraBench,这是一个旨在评估AI代理在处理复杂的地球系统数据时的推理能力的新基准。该基准建立在TerraAgent之上,TerraAgent是一个将大型语言模型与科学工具相结合的框架,用于数据检索、地理空间处理和模拟。TerraBench旨在解决当前AI模型在处理对气候和环境决策至关重要的异构数据源方面的局限性。 AI

影响 该基准可以加速能够对多样化环境数据集进行复杂科学推理的AI代理的开发。

排序理由 该集群包含一篇介绍AI代理新基准和框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Dat Tien Nguyen, Thao Nguyen, Fadillah Adamsyah Maani, Huy M. Le, Muhammad Umer Sheikh, Numan Saeed, Muhammad Haris Khan, Salman Khan ·

    TerraBench: Can Agents Reason Over Heterogeneous Earth-System Data?

    arXiv:2606.13148v1 Announce Type: new Abstract: Climate and environmental decision-making increasingly requires reasoning across heterogeneous inputs, including gridded physical data, satellite imagery, geospatial context, and simulator outputs. Weather and climate foundation mod…