PulseAugur
实时 11:41:50

TrOCR 适配中世纪手稿识别,研究发现

研究人员探索了将 TrOCR 模型应用于中世纪手稿的文字识别(HTR)任务,该任务因模型在现代文本上预训练而变得复杂。通过对 13 世纪意大利手稿(I-CT 91 "Cortonese")和 READ-16 基准进行的受控实验,他们研究了对比度归一化、数据增强和层冻结对准确性的影响。研究发现,移除对比度归一化后,字符错误率(CER)为 7.84%,与专用基线相当,并且特定的层冻结策略可以跨数据集转移,但建议进行特定数据集的重新验证。研究使用了 Grad-CAM 和交叉注意力图来诊断错误模式。 AI

影响 这项研究为微调 Transformer 模型以用于专门的历史文本识别任务提供了见解。

排序理由 该集群包含一篇学术论文,详细介绍了对模型在特定任务上性能进行的系统性研究和消融分析。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

TrOCR 适配中世纪手稿识别,研究发现

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Sachin Sharma, Michele Flammini, Federico Simonetta ·

    TrOCR for Medieval HTR: A Systematic Ablation Study with Cross-Dataset Validation

    arXiv:2606.24302v1 Announce Type: new Abstract: Fine-tuning transformer-based handwritten text recognition (HTR) models on medieval manuscripts is challenging because these models are pre-trained on modern text and must adapt to a very different visual domain. This paper studies …

  2. arXiv cs.CV TIER_1 English(EN) · Federico Simonetta ·

    TrOCR for Medieval HTR: A Systematic Ablation Study with Cross-Dataset Validation

    Fine-tuning transformer-based handwritten text recognition (HTR) models on medieval manuscripts is challenging because these models are pre-trained on modern text and must adapt to a very different visual domain. This paper studies how three controllable fine-tuning choices (cont…