PulseAugur
实时 18:21:18
实体 RollingEval-Jun25

RollingEval-Jun25

PulseAugur coverage of RollingEval-Jun25 — every cluster mentioning RollingEval-Jun25 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_58617 ·

    新研究质疑人类引文作为AI搜索基准的可靠性

    一篇新的研究论文挑战了人类生成的引文列表作为评估文献检索系统可靠性的事实依据。该研究引入了一个“深度研究”管道,与仅使用API的标准搜索相比,显著提高了召回率。研究还发现,与AI排名结果相比,人类引文的相关性较低,并且更偏向于合作者,这表明需要多方面的评估指标。