PulseAugur
实时 12:59:17
实体 TREC 2024

TREC 2024

PulseAugur coverage of TREC 2024 — every cluster mentioning TREC 2024 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_10113 ·

    研究人员推出Auto-ARGUE用于LLM报告生成评估

    研究人员推出Auto-ARGUE,一个用于评估大型语言模型(LLM)生成报告质量的新框架,特别关注使用检索增强生成(RAG)的模型。该系统旨在评估引用支持的报告,这是RAG的一个常见应用。在TREC 2024任务上的初步测试表明,Auto-ARGUE与人类判断高度相关,并且发布了一个名为ARGUE-Viz的可视化工具来辅助分析。