新的基准测试评估PDF解析器提取数学公式的能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-06 04:00

研究人员开发了一个新的框架，用于评估文档解析器从PDF中提取数学公式的性能。该系统使用具有精确LaTeX地面真相的合成生成的PDF，并采用LLM作为裁判的方法来评估解析公式的语义等价性。在100个合成文档上评估超过20个解析器，揭示了显著的性能差异，为实践者提供了指导。 AI

影响提供了一种标准化的方法来评估和改进AI处理和理解学术文献中数学内容的能力。

排序理由该集群包含一篇学术论文，详细介绍了用于评估PDF解析器提取数学公式的新基准测试框架。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Pius Horn, Janis Keuper · 2026-05-06 04:00

基准测试文档解析器从PDF中提取数学公式

arXiv:2512.09874v2 Announce Type: replace Abstract: Correctly parsing mathematical formulas from PDFs is critical for training large language models and building scientific knowledge bases from academic literature, yet existing benchmarks either exclude formulas entirely or lack …