English(EN) UNIKIE-BENCH: Benchmarking Large Multimodal Models for Key Information Extraction in Visual Documents

新基准UNIKIE-BENCH评估大模型在文档信息提取方面的能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-27 04:00

研究人员推出了UNIKIE-BENCH，这是一个旨在系统评估大语言多模态模型（LMMs）从视觉文档中提取关键信息性能的新基准。该基准包含两个赛道：一个用于具有预定义模式的约束类别KIE，另一个用于开放类别KIE。使用15个最先进的LMMs进行的实验突显了在处理不同模式、长尾信息和复杂布局时性能显著下降，表明LMMs在该领域的准确性和推理能力仍面临挑战。 AI

影响为LMMs在文档信息提取方面提供了一个标准化的评估框架，突出了当前的局限性。

排序理由这是一篇介绍用于评估LMMs的新基准的研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Yifan Ji, Zhipeng Xu, Zhenghao Liu, Zulong Chen, Qian Zhang, Zhibo Yang, Junyang Lin, Yu Gu, Ge Yu, Maosong Sun · 2026-04-27 04:00

UNIKIE-BENCH：用于视觉文档关键信息提取的大型多模态模型基准测试

arXiv:2602.07038v2 Announce Type: replace Abstract: Key Information Extraction (KIE) from real-world documents remains challenging due to substantial variations in layout structures, visual quality, and task-specific information requirements. Recent Large Multimodal Models (LMMs)…

报道来源 [1]

UNIKIE-BENCH：用于视觉文档关键信息提取的大型多模态模型基准测试

相关实体

相关话题