English(EN) Page image classifier fine-tuned on century-spanning archives of scanned documents for further content-specific processing

AI模型在历史文档图像分类中达到99%的准确率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了一个高度准确的历史文档图像分类系统，能够区分文本、表格和图形。经过微调的深度学习模型，特别是RegNetY-16GF和ViT-large，在一个包含超过48,000页扫描文档的数据集上达到了99%以上的准确率。该系统旨在促进大规模数字化项目中特定内容的处理，模型、数据集和软件均已根据开源许可证公开提供。 AI

影响能够对大型历史文档档案进行高效的内容特定处理，加速数字化进程。

排序理由该集群包含一篇详细介绍新AI模型及其在特定任务上性能的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Kateryna Lutsai, Pavel Stra\v{n}\'ak, David Nov\'ak, Dana K\v{r}iv\'ankov\'a · 2026-06-09 04:00

页面图像分类器在跨越一个世纪的扫描文档档案上进行微调，以进行进一步的内容特定处理

arXiv:2606.07558v1 Announce Type: cross Abstract: Purpose: Digitization projects in the humanities produce vast, heterogeneous archives of historical documents, making manual sorting impractical at scale. This work addresses the need for an automated system to classify scanned pa…

报道来源 [1]

页面图像分类器在跨越一个世纪的扫描文档档案上进行微调，以进行进一步的内容特定处理

相关实体

相关话题