研究人员推出了GeoDisaster,这是一个旨在评估和改进编排智能体在操作性灾害地理情报方面能力的新基准测试。该基准测试包含五个任务家族的2,921个实例,整合了多样化的地球观测和GIS数据,用于危险探测和损害评估等任务。配套的多智能体框架采用了一种名为角色-契约期望对齐(RCEA)的新颖对齐技术,以增强灾害响应场景中的工具使用和决策能力。 AI
影响 该基准测试有望推动AI智能体在灾害响应和地理情报等现实世界应用中的能力发展。
排序理由 该集群描述了一个用于评估AI智能体的新的学术基准测试及相关框架,已在arXiv上发布。
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- GeoDisaster
- Gotit.pub
- Hugging Face
- RS-VLMs
- ScienceCast
- Sentinel-1 SAR
- Rajasthan Council of Educational Administration and Management
- Sentinel-1
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →