PulseAugur
实时 15:19:55
English(EN) ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

新基准ChartREG++旨在实现图表指代表达式基础化

研究人员推出了ChartREG++,一个旨在改进和评估图表中文本指代表达式基础化能力的新基准。该基准通过支持多种定位形式、处理多实例目标、整合超越简单文本的多种基础化线索以及涵盖更广泛的图表类型,解决了现有数据集的局限性。该论文还提出了一种代码驱动的合成流程,用于生成像素级精确的实例掩码,以训练实例分割模型。当该模型集成到多模态基础化框架中时,在新基准上表现出色,并能泛化到其他图表基础化任务。 AI

影响 为评估多模态模型在图表理解方面的能力树立了新标准,有望推动视觉基础化和推理能力的提升。

排序理由 该集群包含一篇学术论文,介绍了一个特定AI任务的新基准。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新基准ChartREG++旨在实现图表指代表达式基础化

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Wanxiang Che ·

    ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

    Referring expression grounding is a core problem in visual grounding and is widely used as a diagnostic of spatial grounding and reasoning in vision and language models, yet most prior work focuses on natural images. In contrast, existing chart referring expression grounding-rela…