开发了一个新的基准测试,用于评估光学字符识别(OCR)系统在检索增强生成(RAG)应用中的鲁棒性。目前使用字符级指标的OCR基准测试未能捕捉OCR错误如何影响现实世界工业场景中的下游RAG性能。该基准测试包含11种具有挑战性的文档类型,并揭示了高OCR准确性并不能保证有效的RAG,因为结构性和语义性错误会导致严重的检索失败。 AI
影响 强调了在有效部署RAG系统时,OCR评估需要超越字符准确性。
排序理由 这是一篇研究论文,介绍了一个用于在RAG背景下评估OCR系统的新基准测试。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →