新基准QO-Bench测试AI保持查询算子的能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-04 04:00

研究人员推出了QO-Bench，一个旨在评估检索增强生成（RAG）系统在结构化事件数据上回答问题时保留查询算子能力的新基准。该基准由22,984篇新闻文章和614个公司事件组成，包含785个需要精确查询执行而非仅仅语义相关性的问题。当前的RAG系统在维护连接（joins）和交集（intersections）等算子所需的类型化值方面存在困难，常常在检索过程中丢弃关键信息。即使有完美的证据，算子执行仍然是一个重大瓶颈，表明需要改进答案模型，而不仅仅是更好的检索。 AI

影响突出了结构化数据RAG系统的一个关键瓶颈，推动研究朝着算子保持检索和更好的答案模型发展。

排序理由该集群包含一篇介绍AI系统评估新基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Mengao Zhang, Xiang Yang, Chang Liu, Tianhui Tan, Ke-wei Huang · 2026-06-04 04:00

QO-Bench: Diagnosing Query-Operator-Preserving Retrieval over Typed Event Tuples

arXiv:2606.04646v1 Announce Type: cross Abstract: Many real-world questions over business, legal, and scientific corpora are natural-language versions of database-style queries over records latent in text. Existing retrieval-augmented generation (RAG) systems are optimized primar…

报道来源 [1]

QO-Bench: Diagnosing Query-Operator-Preserving Retrieval over Typed Event Tuples

相关实体

相关话题