PulseAugur
实时 16:40:45

新的基准测试评估PDF解析器提取数学公式的能力

研究人员开发了一个新的框架,用于评估文档解析器从PDF中提取数学公式的性能。该系统使用具有精确LaTeX地面真相的合成生成的PDF,并采用LLM作为裁判的方法来评估解析公式的语义等价性。在100个合成文档上评估超过20个解析器,揭示了显著的性能差异,为实践者提供了指导。 AI

影响 提供了一种标准化的方法来评估和改进AI处理和理解学术文献中数学内容的能力。

排序理由 该集群包含一篇学术论文,详细介绍了用于评估PDF解析器提取数学公式的新基准测试框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的基准测试评估PDF解析器提取数学公式的能力

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Pius Horn, Janis Keuper ·

    基准测试文档解析器从PDF中提取数学公式

    arXiv:2512.09874v2 Announce Type: replace Abstract: Correctly parsing mathematical formulas from PDFs is critical for training large language models and building scientific knowledge bases from academic literature, yet existing benchmarks either exclude formulas entirely or lack …