一篇新发表在 arXiv 上的研究分析了拉丁字母和阿拉伯字母手写文本识别 (HTR) 系统的性能差距。研究人员使用了一个统一的卷积循环神经网络 (CRNN) 模型,跨多个数据集和训练规模进行性能比较。研究结果表明,阿拉伯字母的错误率持续更高,尤其是在低资源环境下。尽管随着数据量的增加,这种差距会缩小,但在完全规模下依然存在,部分原因归结于标注质量问题以及阿拉伯字母更高的视觉变异性和重尾字符频率分布。 AI
影响 强调了非拉丁字母手写文本识别 (HTR) 的挑战,表明需要更多数据和更高质量的标注来确保公平的性能。
排序理由 学术论文,详细分析了 HTR 系统的性能差距。[lever_c_demoted from research: ic=1 ai=1.0]
- Convolutional Recurrent Neural Network
- IAM
- KHATT
- Muharaf
- NUST-UHWR
- READ-2016
- Sana Sabah Sabry Al-Azzawi
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →