PulseAugur
实时 14:02:15
English(EN) ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

新的基准和合成管道增强了图表指代表达式的定位

研究人员推出了 ChartREG++,这是一个旨在改进图表中指代表达式定位的新基准。该基准通过支持多种定位形式、处理多实例引用、整合多样化的定位线索以及涵盖更广泛的图表类型,解决了现有数据集的局限性。研究团队还开发了一个代码驱动的合成管道,用于生成用于训练实例分割模型的像素级精确实例掩码,当将其集成到多模态定位框架中时,该模型在其基准测试中表现出色,并泛化到现实世界的图表定位任务。 AI

影响 增强了多模态模型在复杂图表可视化中解释和定位信息的能力。

排序理由 该集群包含一篇研究论文,介绍了一项特定人工智能任务的新基准和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Tianhao Niu, Ziyu Han, Xuan Dong, Qingfu Zhu, Wanxiang Che ·

    ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring

    arXiv:2605.07415v2 Announce Type: replace-cross Abstract: Referring expression grounding is a core problem in visual grounding and is widely used as a diagnostic of spatial grounding and reasoning in vision and language models, yet most prior work focuses on natural images. In co…