English(EN) ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

新的基准和合成管道增强了图表指代表达式的定位

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 04:00

研究人员推出了 ChartREG++，这是一个旨在改进图表中指代表达式定位的新基准。该基准通过支持多种定位形式、处理多实例引用、整合多样化的定位线索以及涵盖更广泛的图表类型，解决了现有数据集的局限性。研究团队还开发了一个代码驱动的合成管道，用于生成用于训练实例分割模型的像素级精确实例掩码，当将其集成到多模态定位框架中时，该模型在其基准测试中表现出色，并泛化到现实世界的图表定位任务。 AI

影响增强了多模态模型在复杂图表可视化中解释和定位信息的能力。

排序理由该集群包含一篇研究论文，介绍了一项特定人工智能任务的新基准和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Tianhao Niu, Ziyu Han, Xuan Dong, Qingfu Zhu, Wanxiang Che · 2026-06-10 04:00

ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

arXiv:2605.07415v2 Announce Type: replace-cross Abstract: Referring expression grounding is a core problem in visual grounding and is widely used as a diagnostic of spatial grounding and reasoning in vision and language models, yet most prior work focuses on natural images. In co…

报道来源 [1]

ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

相关话题