研究人员开发了一种在新方法,用于在低资源场景下对复杂文档布局进行分类。该方法结合了卷积神经网络(CNN)和新颖的数据增强技术,包括窄各向异性高斯掩码和反射诱导标签转换。这些方法通过抑制偶然的文本细节同时保留重要的结构信息,帮助模型学习全局几何排列。所提出的策略显著提高了页面级布局分类的准确性,即使在标注严重稀缺的情况下。 AI
影响 这项研究为改进资源匮乏语言或复杂历史文档的文档分析提供了潜在的解决方案。
排序理由 该集群包含一篇详细介绍计算机视觉任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →