English(EN) Benchmarking OCR Pipelines with Adaptive Enhancement for Multi-Domain Retail Bill Digitization

新的OCR管道通过自适应增强提升零售账单数字化效果

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 03:31

研究人员开发并对一个自适应光学字符识别（OCR）管道进行了基准测试，该管道专门用于数字化各种零售账单。该系统包含一个基于CNN的增强模块、一个图像质量分析器和一个基于NLP的校正层，以处理扫描质量和布局的变化。所提出的管道在Tesseract基线之上取得了显著的改进，在一个包含360张零售账单图像的数据集上，字符错误率（CER）为18.4%，单词错误率（WER）为27.6%。 AI

影响为零售账单数字化的OCR树立了新的基准，有望提高处理各种文档格式的企业的效率。

排序理由这是一篇详细介绍新OCR管道及其基准测试结果的研究论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-04-28 03:31

使用自适应增强对多领域零售账单进行 OCR 管道基准测试以实现数字化

The digitization of multi-domain retail billing documents remains a challenging task due to variability in scan quality, layout heterogeneity, and domain diversity across commercial sectors. This paper proposes and benchmarks an intelligent, quality-aware adaptive Optical Charact…

报道来源 [1]

使用自适应增强对多领域零售账单进行 OCR 管道基准测试以实现数字化

相关实体

相关话题