研究人员开发了 RT-DocLayout,一个高效的端到端文档布局分析和阅读顺序预测框架。这个基于 RT-DETR 的单一模型在 3300 万参数的架构中统一了分类、检测、分割和阅读顺序预测。实验表明,RT-DocLayout 实现了最先进的性能和实时推理速度,并显著提高了下游 OCR 引擎的重建质量。 AI
影响 该模型可以显著提高文档解析和信息提取系统的效率和准确性。
排序理由 该条目是一篇研究论文,详细介绍了新模型及其在基准测试上的性能。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX Code Finder for Papers
- Connected Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- Influence Flower
- Litmaps
- RT-DETR
- RT-DocLayout
- ScienceCast
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →