PulseAugur
实时 11:41:38

HTR pipeline digitizes historical Nepali manuscripts with 4.9% error rate

研究人员开发了一个新的端到端手写文本识别(HTR)流水线,专门用于旧尼泊尔手稿。该系统旨在数字化一种具有历史意义但资源匮乏的语言。性能最佳的模型实现了 4.9% 的字符错误率(CER),研究团队已发布了他们的训练代码和评估脚本,以鼓励该领域的进一步研究。 AI

影响 实现了低资源历史文字的数字化,可能为语言学和历史研究开辟新途径。

排序理由 这是一篇研究论文,介绍了一种用于历史手稿手写文本识别的新流水线。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

HTR pipeline digitizes historical Nepali manuscripts with 4.9% error rate

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Anjali Sarawgi, Esteban Garces Arias, Christof Zotter ·

    数字化尼泊尔书面遗产:老尼泊尔手稿的综合HTR管道

    arXiv:2512.17111v2 Announce Type: replace Abstract: This paper presents the first end-to-end pipeline for Handwritten Text Recognition (HTR) for Old Nepali, a historically significant but low-resource language. We adopt a line-level transcription approach and systematically explo…