实体 QO-Bench

QO-Bench

PulseAugur coverage of QO-Bench — every cluster mentioning QO-Bench across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_70314 · Jun 4 · 04:00

新基准QO-Bench测试AI保持查询算子的能力

研究人员推出了QO-Bench，一个旨在评估检索增强生成（RAG）系统在结构化事件数据上回答问题时保留查询算子能力的新基准。该基准由22,984篇新闻文章和614个公司事件组成，包含785个需要精确查询执行而非仅仅语义相关性的问题。当前的RAG系统在维护连接（joins）和交集（intersections）等算子所需的类型化值方面存在困难，常常在检索过程中丢弃关键信息。即使有完美的证据，算子执行仍然是一个重大瓶颈，表明需要改进答案模型…