PulseAugur
实时 12:33:52
English(EN) RT-DocLayout: Real-Time End-to-End Document Layout Analysis with Reading Order in the Wild

RT-DocLayout 通过统一架构实现实时文档分析

研究人员开发了 RT-DocLayout,一个高效的端到端文档布局分析和阅读顺序预测框架。这个基于 RT-DETR 的单一模型在 3300 万参数的架构中统一了分类、检测、分割和阅读顺序预测。实验表明,RT-DocLayout 实现了最先进的性能和实时推理速度,并显著提高了下游 OCR 引擎的重建质量。 AI

影响 该模型可以显著提高文档解析和信息提取系统的效率和准确性。

排序理由 该条目是一篇研究论文,详细介绍了新模型及其在基准测试上的性能。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

RT-DocLayout 通过统一架构实现实时文档分析

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Yi Liu ·

    RT-DocLayout: Real-Time End-to-End Document Layout Analysis with Reading Order in the Wild

    Accurate document layout analysis remains a critical bottleneck for document parsing systems, due to the intricate coupling among heterogeneous document layout elements, geometric distortions (\eg, paper warping and bending, perspective variations), and reading order within diver…