研究人员开发了一个高度准确的历史文档图像分类系统,能够区分文本、表格和图形。经过微调的深度学习模型,特别是RegNetY-16GF和ViT-large,在一个包含超过48,000页扫描文档的数据集上达到了99%以上的准确率。该系统旨在促进大规模数字化项目中特定内容的处理,模型、数据集和软件均已根据开源许可证公开提供。 AI
影响 能够对大型历史文档档案进行高效的内容特定处理,加速数字化进程。
排序理由 该集群包含一篇详细介绍新AI模型及其在特定任务上性能的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →