English(EN) Benchmarking OCR Pipelines with Adaptive Enhancement for Multi-Domain Retail Bill Digitization

新的OCR流水线通过自适应增强提升零售账单数字化效果

作者 PulseAugur 编辑部 · [2 个来源] · 2026-04-28 03:31

研究人员开发并对一个自适应光学字符识别（OCR）流水线进行了基准测试，该流水线专为跨不同商业领域的零售账单数字化而设计。该系统包含一个基于CNN的图像增强模块、一个图像质量分析器、一个用于迭代重试的反馈循环以及一个基于NLP的校正层。在包含360张零售账单的数据集上进行测试，该流水线实现了18.4%的字符错误率（CER）和27.6%的单词错误率（WER），显著优于原始Tesseract基线，并显示出比EasyOCR更快的速度优势。 AI

影响为零售领域的OCR树立了新基准，有望提高企业的数据提取效率。

排序理由学术论文，详细介绍了新的OCR流水线及其基准测试性能。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Vijaysinh Gaikwad · 2026-04-29 04:00

使用自适应增强技术对多领域零售账单进行 OCR 流水线基准测试以实现数字化

arXiv:2604.25176v1 Announce Type: new Abstract: The digitization of multi-domain retail billing documents remains a challenging task due to variability in scan quality, layout heterogeneity, and domain diversity across commercial sectors. This paper proposes and benchmarks an int…
arXiv cs.CV TIER_1 English(EN) · Vijaysinh Gaikwad · 2026-04-28 03:31

使用自适应增强技术对多领域零售账单进行OCR管道基准测试以实现数字化

The digitization of multi-domain retail billing documents remains a challenging task due to variability in scan quality, layout heterogeneity, and domain diversity across commercial sectors. This paper proposes and benchmarks an intelligent, quality-aware adaptive Optical Charact…

报道来源 [2]

使用自适应增强技术对多领域零售账单进行 OCR 流水线基准测试以实现数字化

使用自适应增强技术对多领域零售账单进行OCR管道基准测试以实现数字化

相关实体

相关话题