PulseAugur
实时 17:45:49

新的AI方法使用低资源数据改进文档布局分类

研究人员开发了一种在新方法,用于在低资源场景下对复杂文档布局进行分类。该方法结合了卷积神经网络(CNN)和新颖的数据增强技术,包括窄各向异性高斯掩码和反射诱导标签转换。这些方法通过抑制偶然的文本细节同时保留重要的结构信息,帮助模型学习全局几何排列。所提出的策略显著提高了页面级布局分类的准确性,即使在标注严重稀缺的情况下。 AI

影响 这项研究为改进资源匮乏语言或复杂历史文档的文档分析提供了潜在的解决方案。

排序理由 该集群包含一篇详细介绍计算机视觉任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Sharva Gogawale, Iddo Hakim, Gal Grudka, Mohammad Suliman, Omer Ventura, Daria Vasyutinsky-Shapira, Berat Kurar-Barakat, Nachum Dershowitz ·

    Complex Layout Classification in the Wild: A Low-Resource Approach with Layout-Preserving Augmentations

    arXiv:2606.17355v1 Announce Type: new Abstract: Many digitized corpora suffer from low resources because annotations may be scarce, page scans are noisy and of poor resolution, or layouts are structurally complex in ways that negatively affect the quality of automatic transcripti…