English(EN) ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

新基准ChartREG++旨在实现图表指代表达式基础化

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 08:07

研究人员推出了ChartREG++，一个旨在改进和评估图表中文本指代表达式基础化能力的新基准。该基准通过支持多种定位形式、处理多实例目标、整合超越简单文本的多种基础化线索以及涵盖更广泛的图表类型，解决了现有数据集的局限性。该论文还提出了一种代码驱动的合成流程，用于生成像素级精确的实例掩码，以训练实例分割模型。当该模型集成到多模态基础化框架中时，在新基准上表现出色，并能泛化到其他图表基础化任务。 AI

影响为评估多模态模型在图表理解方面的能力树立了新标准，有望推动视觉基础化和推理能力的提升。

排序理由该集群包含一篇学术论文，介绍了一个特定AI任务的新基准。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Wanxiang Che · 2026-05-08 08:07

ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

Referring expression grounding is a core problem in visual grounding and is widely used as a diagnostic of spatial grounding and reasoning in vision and language models, yet most prior work focuses on natural images. In contrast, existing chart referring expression grounding-rela…

报道来源 [1]

ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

相关实体

相关话题