PulseAugur
实时 20:55:34
English(EN) HalalBench: A Multilingual OCR Benchmark for Food Packaging Ingredient Extraction

HalalBench 基准测试解决了多语言食品包装成分提取的 OCR 挑战

研究人员推出了 HalalBench,这是一个新的多语言基准测试,旨在评估光学字符识别(OCR)在食品包装成分标签上的性能。该基准测试解决了这些标签带来的独特挑战,例如曲面、多语言密集文本和小字体,这些在现有的 OCR 基准测试中通常找不到。HalalBench 包含一千多张图像,涵盖 14 种语言的数万个标注,初步评估显示,包括一些领先的 OCR 引擎在内的性能不佳,尤其是在处理日语文本时。 AI

影响 为食品包装上的 OCR 提供了一个专门的基准测试,有可能提高清真认证系统的准确性。

排序理由 该集群描述了一个特定 OCR 任务的新学术基准数据集的发布。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

HalalBench 基准测试解决了多语言食品包装成分提取的 OCR 挑战

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Hasan Arief ·

    HalalBench: A Multilingual OCR Benchmark for Food Packaging Ingredient Extraction

    arXiv:2604.22754v1 Announce Type: new Abstract: No standardized benchmark exists for evaluating OCR on food packaging, despite its critical role in automated halal food verification. Existing benchmarks target documents or scene text, missing the unique challenges of ingredient l…