PulseAugur
实时 19:36:00
实体 UNIKIE-BENCH

UNIKIE-BENCH

PulseAugur coverage of UNIKIE-BENCH — every cluster mentioning UNIKIE-BENCH across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_05112 ·

    新基准UNIKIE-BENCH评估大模型在文档信息提取方面的能力

    研究人员推出了UNIKIE-BENCH,这是一个旨在系统评估大语言多模态模型(LMMs)从视觉文档中提取关键信息性能的新基准。该基准包含两个赛道:一个用于具有预定义模式的约束类别KIE,另一个用于开放类别KIE。使用15个最先进的LMMs进行的实验突显了在处理不同模式、长尾信息和复杂布局时性能显著下降,表明LMMs在该领域的准确性和推理能力仍面临挑战。