PulseAugur
实时 22:39:11
实体 MuDABench

MuDABench

PulseAugur coverage of MuDABench — every cluster mentioning MuDABench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_04987 ·

    新的MuDABench基准测试跨海量文档集合的分析式问答

    研究人员推出了MuDABench,这是一个专为跨大型文档集合进行分析式问答设计的新基准。该基准要求系统综合来自众多来源的信息以执行定量分析,这是当前检索增强生成(RAG)系统难以胜任的任务。提出的多代理工作流程显示出有所改进,但仍未达到人类专家的表现,凸显了信息提取和领域特定知识方面的挑战。