研究人员开发了一个新的端到端手写文本识别(HTR)流水线,专门用于旧尼泊尔手稿。该系统旨在数字化一种具有历史意义但资源匮乏的语言。性能最佳的模型实现了 4.9% 的字符错误率(CER),研究团队已发布了他们的训练代码和评估脚本,以鼓励该领域的进一步研究。 AI
影响 实现了低资源历史文字的数字化,可能为语言学和历史研究开辟新途径。
排序理由 这是一篇研究论文,介绍了一种用于历史手稿手写文本识别的新流水线。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →