研究人员推出了一款用于历史天文图文本检测的新数据集,填补了文档分析领域的空白。该数据集包含 948 幅 8 至 18 世纪的图表,拥有超过 10,000 个带精确多边形边界和阅读方向编码的标注文本区域。研究评估了几种基线模型,其中 Poly-DETR(DINO-DETR 的扩展)在现有基准测试中表现强劲,并可作为此新数据集的坚实基线。该数据集和代码均公开可用。 AI
排序理由 该集群描述了一篇介绍数据集并评估特定计算机视觉任务基线模型的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →