PulseAugur
实时 11:34:24
实体 TABVERSE

TABVERSE

PulseAugur coverage of TABVERSE — every cluster mentioning TABVERSE across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_79440 ·

    新的基准测试TABVERSE测试LLM的跨格式表格理解能力

    研究人员推出TABVERSE,一个旨在评估大型语言模型(LLM)和视觉语言模型(VLM)在不同格式表格理解能力的新基准测试。该基准测试在保持表格内容标准化的同时,改变其表示形式,例如HTML、Markdown、LaTeX和渲染图像。初步研究结果表明,模型的性能受到表格格式的显著影响,结构化文本通常优于图像,但特定的任务和格式会带来独特的挑战。