研究人员推出了 HalalBench,这是一个新的多语言基准测试,旨在评估光学字符识别(OCR)在食品包装成分标签上的性能。该基准测试解决了这些标签带来的独特挑战,例如曲面、多语言密集文本和小字体,这些在现有的 OCR 基准测试中通常找不到。HalalBench 包含一千多张图像,涵盖 14 种语言的数万个标注,初步评估显示,包括一些领先的 OCR 引擎在内的性能不佳,尤其是在处理日语文本时。 AI
影响 为食品包装上的 OCR 提供了一个专门的基准测试,有可能提高清真认证系统的准确性。
排序理由 该集群描述了一个特定 OCR 任务的新学术基准数据集的发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →