PulseAugur
实时 20:20:17
实体 Item-F1

Item-F1

PulseAugur coverage of Item-F1 — every cluster mentioning Item-F1 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_115252 ·

    新的Ko-WideSearch基准显示网络代理在广度搜索任务中存在困难

    一个名为Ko-WideSearch的新基准已被开发出来,用于评估网络代理的广度搜索能力,重点关注穷举集枚举而非基于深度的问答。这个韩语基准通过自动化流程构建,包含190个实体和16个类别的228张表格。对20个网络代理的初步测试显示,即使在整体集合成员资格被正确识别的情况下,它们在准确恢复行级属性方面也持续失败,这表明当前AI系统面临重大挑战。