研究人员推出了ChartREG++,一个旨在改进和评估图表中文本指代表达式基础化能力的新基准。该基准通过支持多种定位形式、处理多实例目标、整合超越简单文本的多种基础化线索以及涵盖更广泛的图表类型,解决了现有数据集的局限性。该论文还提出了一种代码驱动的合成流程,用于生成像素级精确的实例掩码,以训练实例分割模型。当该模型集成到多模态基础化框架中时,在新基准上表现出色,并能泛化到其他图表基础化任务。 AI
影响 为评估多模态模型在图表理解方面的能力树立了新标准,有望推动视觉基础化和推理能力的提升。
排序理由 该集群包含一篇学术论文,介绍了一个特定AI任务的新基准。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →