研究人员已将一种名为不确定性群集(Uncertainty Herding, UHerding)的主动学习策略应用于表格提取中使用的级联目标检测管道。此举旨在减轻昂贵的标注负担,特别是对于表格结构识别(Table Structure Recognition, TSR)。提出的扩展方法 RankFusion 和 CAPA,通过结合双流形覆盖和具有不确定性校准的阶段依赖门控,利用表格检测(Table Detection, TD)和 TSR 阶段之间的依赖性。在多个数据集上的实验表明,UHerding 的性能优于基线方法,其中 CAPA 成为一种一致且有效的方法。 AI
影响 这项研究可能带来更高效、更具成本效益的文档分析和数据提取人工智能模型的训练。
排序理由 该集群包含一篇详细介绍机器学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →