研究人员推出了UNIKIE-BENCH,这是一个旨在系统评估大语言多模态模型(LMMs)从视觉文档中提取关键信息性能的新基准。该基准包含两个赛道:一个用于具有预定义模式的约束类别KIE,另一个用于开放类别KIE。使用15个最先进的LMMs进行的实验突显了在处理不同模式、长尾信息和复杂布局时性能显著下降,表明LMMs在该领域的准确性和推理能力仍面临挑战。 AI
影响 为LMMs在文档信息提取方面提供了一个标准化的评估框架,突出了当前的局限性。
排序理由 这是一篇介绍用于评估LMMs的新基准的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →