研究人员开发了一种新颖的两阶段框架CER-HV,旨在提高用于训练手写文本识别(HTR)模型的数据集质量,特别是针对阿拉伯文脚本语言。该框架结合了卷积循环神经网络(CRNN)进行自动错误检测和“人在回路”验证过程。当应用于阿拉伯文数据集时,CER-HV成功识别了转录和分割错误等标签错误,在数据集清理和模型重新训练后,评估CER提高了多达1.8个百分点。 AI
影响 提高了阿拉伯文HTR数据集的质量,可能加速该领域的研发。
排序理由 该集群包含一篇详细介绍新框架和实验结果的学术论文,符合研究类别。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →