研究人员开发了一种名为几何感知指针(GAP)损失的新损失函数,以改进计算机视觉中的表格结构识别(TSR)。这种新颖的方法解决了一个常见的失败模式,即在空间相邻单元格之间发生错误,而标准的交叉熵损失对此类错误惩罚不足。通过根据空间邻近性重新加权损失,GAP 损失将更强的梯度导向这些困难的相邻单元格。GAP 损失应用于现有的指针网络架构,且没有增加推理成本,已在 PubTabNet 和 SynthTabNet 等基准数据集上显示出显著的改进,通过减少相邻单元格错误,确立了新的最先进性能。 AI
影响 引入了一种更强大的表格结构识别方法,有可能改进文档理解和从复杂布局中提取数据。
排序理由 介绍用于计算机视觉任务的新颖损失函数的论文。 [lever_c_research降级:ic=1 ai=1.0]
- Gap loss
- Geometry-Aware Pointer Loss
- Pointer Networks
- PubTabNet
- SynthTabNet
- Table Structure Recognition
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →