研究人员探索了将 TrOCR 模型应用于中世纪手稿的文字识别(HTR)任务,该任务因模型在现代文本上预训练而变得复杂。通过对 13 世纪意大利手稿(I-CT 91 "Cortonese")和 READ-16 基准进行的受控实验,他们研究了对比度归一化、数据增强和层冻结对准确性的影响。研究发现,移除对比度归一化后,字符错误率(CER)为 7.84%,与专用基线相当,并且特定的层冻结策略可以跨数据集转移,但建议进行特定数据集的重新验证。研究使用了 Grad-CAM 和交叉注意力图来诊断错误模式。 AI
影响 这项研究为微调 Transformer 模型以用于专门的历史文本识别任务提供了见解。
排序理由 该集群包含一篇学术论文,详细介绍了对模型在特定任务上性能进行的系统性研究和消融分析。
- Contrast Limited Adaptive Histogram Equalization
- Federico Simonetta
- Grad-CAM++
- Hugging Face
- I-CT 91 "Cortonese"
- READ-16
- TrOCR
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →