PulseAugur
实时 14:46:13
English(EN) HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers

新的基准测试可检验视觉语言模型对日本图表的理解能力

研究人员开发了 HakushoBench,这是一个用于评估视觉语言模型(VLM)理解日本图表能力的新基准测试。该数据集来自 33 份日本政府白皮书,包含 2,000 多张图片以及手动标注的问答对。初步实验显示,开源模型和专有模型之间存在显著的性能差距,表明在处理复杂的非英语文档分析方面,VLM 的能力还有很大的提升空间。 AI

影响 为非英语视觉数据上的 VLM 性能建立了新的评估标准,有望推动多语言文档理解能力的提升。

排序理由 该集群描述了一个用于评估 AI 模型的新学术基准数据集。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. Hugging Face Daily Papers TIER_1 English(EN) ·

    HakushoBench: 来自政府白皮书的日本图表和表格VQA基准测试

    Researchers created HakushoBench, a Japanese chart and table visual question answering benchmark derived from governmental documents, to evaluate vision-language models' ability to understand complex visual data beyond English-language datasets.

  2. arXiv cs.CV TIER_1 English(EN) · Issa Sugiura, Shuhei Kurita, Yusuke Oda, Naoaki Okazaki ·

    HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers

    arXiv:2606.01132v1 Announce Type: new Abstract: Understanding chart and table images is essential for applying vision-language models (VLMs) to real-world document understanding. While English benchmarks have advanced rapidly, non-English counterparts remain scarce, leaving it un…