English(EN) HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers

新的基准测试可检验视觉语言模型对日本图表的理解能力

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-31 00:00

研究人员开发了 HakushoBench，这是一个用于评估视觉语言模型（VLM）理解日本图表能力的新基准测试。该数据集来自 33 份日本政府白皮书，包含 2,000 多张图片以及手动标注的问答对。初步实验显示，开源模型和专有模型之间存在显著的性能差距，表明在处理复杂的非英语文档分析方面，VLM 的能力还有很大的提升空间。 AI

影响为非英语视觉数据上的 VLM 性能建立了新的评估标准，有望推动多语言文档理解能力的提升。

排序理由该集群描述了一个用于评估 AI 模型的新学术基准数据集。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-31 00:00

HakushoBench: 来自政府白皮书的日本图表和表格VQA基准测试

Researchers created HakushoBench, a Japanese chart and table visual question answering benchmark derived from governmental documents, to evaluate vision-language models' ability to understand complex visual data beyond English-language datasets.
arXiv cs.CV TIER_1 English(EN) · Issa Sugiura, Shuhei Kurita, Yusuke Oda, Naoaki Okazaki · 2026-06-02 04:00

HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers

arXiv:2606.01132v1 Announce Type: new Abstract: Understanding chart and table images is essential for applying vision-language models (VLMs) to real-world document understanding. While English benchmarks have advanced rapidly, non-English counterparts remain scarce, leaving it un…

报道来源 [2]

HakushoBench: 来自政府白皮书的日本图表和表格VQA基准测试

HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers

相关实体

相关话题