PulseAugur
实时 12:31:21
实体 ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in English

ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in English

PulseAugur coverage of ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in English — every cluster mentioning ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in English across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_07033 ·

    ClimAgent框架使用LLM进行自主气候科学分析

    研究人员开发了ClimAgent,一个旨在处理复杂气候科学分析任务的自主框架。该系统集成了统一的工具使用环境和推理协议,以执行端到端的建模和分析,超越了简单的问答。为了评估其性能,引入了一个名为ClimaBench的新基准,其中包含来自专业气候场景的问题。实验表明,与现有的LLM方法相比,ClimAgent在解决方案的严谨性和实用性方面提高了40.21%。