English(EN) Performance Gap Analysis between Latin and Arabic Scripts HTR

手写文本识别 (HTR) 系统在阿拉伯字母与拉丁字母识别上持续存在性能差距

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-17 10:00

一篇新发表在 arXiv 上的研究分析了拉丁字母和阿拉伯字母手写文本识别 (HTR) 系统的性能差距。研究人员使用了一个统一的卷积循环神经网络 (CRNN) 模型，跨多个数据集和训练规模进行性能比较。研究结果表明，阿拉伯字母的错误率持续更高，尤其是在低资源环境下。尽管随着数据量的增加，这种差距会缩小，但在完全规模下依然存在，部分原因归结于标注质量问题以及阿拉伯字母更高的视觉变异性和重尾字符频率分布。 AI

影响强调了非拉丁字母手写文本识别 (HTR) 的挑战，表明需要更多数据和更高质量的标注来确保公平的性能。

排序理由学术论文，详细分析了 HTR 系统的性能差距。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Marcus Liwicki · 2026-06-17 10:00

拉丁字母和阿拉伯字母手写识别（HTR）的性能差距分析

Recent studies have shown that handwritten text recognition (HTR) systems perform worse on Arabic-script datasets than on Latin-script data. However, the reasons for this gap are still not well understood due to the lack of controlled comparisons. In this work, we present a compr…

报道来源 [1]

拉丁字母和阿拉伯字母手写识别（HTR）的性能差距分析

相关实体

相关话题