PulseAugur
实时 11:36:12
English(EN) Rethinking the Pointer Loss in Table Structure Recognition: Geometry-Aware Pointer Loss for Spatial Locality

新的几何感知损失提高了表格结构识别的准确性

研究人员开发了一种名为几何感知指针(GAP)损失的新损失函数,以改进计算机视觉中的表格结构识别(TSR)。这种新颖的方法解决了一个常见的失败模式,即在空间相邻单元格之间发生错误,而标准的交叉熵损失对此类错误惩罚不足。通过根据空间邻近性重新加权损失,GAP 损失将更强的梯度导向这些困难的相邻单元格。GAP 损失应用于现有的指针网络架构,且没有增加推理成本,已在 PubTabNetSynthTabNet 等基准数据集上显示出显著的改进,通过减少相邻单元格错误,确立了新的最先进性能。 AI

影响 引入了一种更强大的表格结构识别方法,有可能改进文档理解和从复杂布局中提取数据。

排序理由 介绍用于计算机视觉任务的新颖损失函数的论文。 [lever_c_research降级:ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的几何感知损失提高了表格结构识别的准确性

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Jaeyoung Kim ·

    重新思考表格结构识别中的指针损失:面向空间局部性的几何感知指针损失

    Table Structure Recognition (TSR) using a pointer network achieves impressive results by predicting HTML sequences while aligning tags to detected text (or cell) regions. However, our analysis reveals that when pointer networks fail, 79.6% of errors occur between spatially adjace…