实体
RAGBench
RAGBench
PulseAugur coverage of RAGBench — every cluster mentioning RAGBench across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
研究显示 RAG 系统准确率触及天花板,复杂查询处理困难
检索增强生成(RAG)系统面临性能瓶颈,即使是高级实现,在处理复杂的企业查询时准确率也难以超过 70-85%。尽管混合搜索和代理管道有所改进,RAG 的有效性仍受限于固有挑战,尤其是在法律和医疗保健等准确性至关重要的领域。最近的研究表明,即使是 GPT-5.5 等领先模型也表现出高幻觉率,而像 Westlaw 和 LexisNexis 这样的成熟法律 AI 工具在复杂任务上的准确率也显著下降,未能消除幻觉。
-
New method distills enterprise knowledge into navigable agent skills for QA
Researchers have developed a new method called Corpus2Skill that enhances Retrieval-Augmented Generation (RAG) by allowing LLM agents to navigate a hierarchical skill directory derived from a document corpus. This appro…