PulseAugur
实时 09:08:42
实体 QO-Bench

QO-Bench

PulseAugur coverage of QO-Bench — every cluster mentioning QO-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70314 ·

    新基准QO-Bench测试AI保持查询算子的能力

    研究人员推出了QO-Bench,一个旨在评估检索增强生成(RAG)系统在结构化事件数据上回答问题时保留查询算子能力的新基准。该基准由22,984篇新闻文章和614个公司事件组成,包含785个需要精确查询执行而非仅仅语义相关性的问题。当前的RAG系统在维护连接(joins)和交集(intersections)等算子所需的类型化值方面存在困难,常常在检索过程中丢弃关键信息。即使有完美的证据,算子执行仍然是一个重大瓶颈,表明需要改进答案模型…