研究人员开发了POTATR,一种用于从文档中提取表格的新型轻量级图像到图模型。这个拥有2900万参数的模型在PubTables-v2基准测试上显著优于现有方法,取得了0.964的GriTS_Con分数。与当前的大型语言模型相比,POTATR的速度更快、成本效益更高,其输出具有空间定位功能,便于验证和进一步集成。 AI
影响 为高效准确的表格提取设定了新标准,有望加速文档处理工作流程。
排序理由 关于新模型和基准测试结果的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →