研究人员开发了一个新的框架,用于评估文档解析器从PDF中提取数学公式的性能。该系统使用具有精确LaTeX地面真相的合成生成的PDF,并采用LLM作为裁判的方法来评估解析公式的语义等价性。在100个合成文档上评估超过20个解析器,揭示了显著的性能差异,为实践者提供了指导。 AI
影响 提供了一种标准化的方法来评估和改进AI处理和理解学术文献中数学内容的能力。
排序理由 该集群包含一篇学术论文,详细介绍了用于评估PDF解析器提取数学公式的新基准测试框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →