PulseAugur
实时 18:29:20
Italiano(IT) Page image classification for content-specific data processing

AI对历史文档页面进行分类,以进行定制化内容处理

研究人员开发了一个由AI驱动的图像分类系统,用于自动对历史文档的页面进行分类。该系统旨在通过识别手写文本、印刷文字和图形元素等不同内容类型来简化数字化档案的处理。分类能够实现定制化的分析流程,例如专门对文本密集型页面应用光学字符识别(OCR)。 AI

影响 自动化历史文档页面的分类,实现更高效和专业的数字处理工作流程。

排序理由 该项目是一篇学术论文,详细介绍了一种基于AI的历史文档图像分类新系统。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI对历史文档页面进行分类,以进行定制化内容处理

报道来源 [1]

  1. arXiv cs.CV TIER_1 Italiano(IT) · Kateryna Lutsai, Pavel Stra\v{n}\'ak ·

    Page image classification for content-specific data processing

    arXiv:2507.21114v3 Announce Type: replace-cross Abstract: Digitization projects in humanities often generate vast quantities of page images from historical documents, presenting significant challenges for manual sorting and analysis. These archives contain diverse content, includ…