PulseAugur
实时 07:24:34
实体 Search-Time Contamination

Search-Time Contamination

PulseAugur coverage of Search-Time Contamination — every cluster mentioning Search-Time Contamination across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_74401 ·

    研究论文警告“搜索时污染”会夸大AI代理基准测试结果

    一篇新研究论文指出了深度研究代理中存在的一个问题,称为搜索时污染(STC),这些代理在评估中使用网络搜索。当代理从网络检索基准元数据、问题上下文或答案时,就会发生这种污染,从而人为地夸大了它们的性能。研究发现STC可以将性能夸大高达4%,并提倡采用防污染的评估实践,例如隔离的沙箱和受控的基准访问。