PulseAugur
实时 11:36:47
English(EN) Active Learning for Cascaded Object Detection: Balancing Coverage and Uncertainty in Table Extraction Pipelines

新的主动学习方法增强表格提取管道

研究人员已将一种名为不确定性群集(Uncertainty Herding, UHerding)的主动学习策略应用于表格提取中使用的级联目标检测管道。此举旨在减轻昂贵的标注负担,特别是对于表格结构识别(Table Structure Recognition, TSR)。提出的扩展方法 RankFusionCAPA,通过结合双流形覆盖和具有不确定性校准的阶段依赖门控,利用表格检测(Table Detection, TD)和 TSR 阶段之间的依赖性。在多个数据集上的实验表明,UHerding 的性能优于基线方法,其中 CAPA 成为一种一致且有效的方法。 AI

影响 这项研究可能带来更高效、更具成本效益的文档分析和数据提取人工智能模型的训练。

排序理由 该集群包含一篇详细介绍机器学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的主动学习方法增强表格提取管道

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Eliott Thomas, Mickael Coustaty, Aurelie Joseph, Gaspar Deloin, Vincent Poulain d'Andecy, Jean-Marc Ogier ·

    Active Learning for Cascaded Object Detection: Balancing Coverage and Uncertainty in Table Extraction Pipelines

    arXiv:2607.00747v1 Announce Type: cross Abstract: Table extraction from business documents relies on a cascaded pipeline where Table Detection (TD) first localizes tables and Table Structure Recognition (TSR) then recovers their internal layout. Building task-specific training se…

  2. arXiv cs.AI TIER_1 English(EN) · Jean-Marc Ogier ·

    用于级联目标检测的主动学习:平衡表格提取管道中的覆盖率和不确定性

    Table extraction from business documents relies on a cascaded pipeline where Table Detection (TD) first localizes tables and Table Structure Recognition (TSR) then recovers their internal layout. Building task-specific training sets for this pipeline is costly, particularly for T…