研究人员开发了一种新颖的、无需训练的框架,用于推断复杂文档布局中的阅读顺序,这对于数字化历史手稿尤其有益。这种基于图的方法将 OCR 文本行视为节点,并使用语言模型信号(如条件似然和 BERT 的下一句预测)对过渡进行评分。为了减轻级联错误,它采用了最大遗憾推断规则,优先考虑高机会成本的承诺。该方法在处理 Glossa Ordinaria 的挑战性布局时,在后继边准确率上显著优于 XY-cut 和 LayoutReader 等现有技术,达到 95%,在 OmniDocBench 的多栏子集上达到 88%。 AI
影响 提高了文档数字化准确性,尤其是在处理布局复杂的历史文本时。
排序理由 该项目是一篇学术论文,详细介绍了一种新的文档布局分析方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →