研究人员推出了 ChartREG++,这是一个旨在改进图表中指代表达式定位的新基准。该基准通过支持多种定位形式、处理多实例引用、整合多样化的定位线索以及涵盖更广泛的图表类型,解决了现有数据集的局限性。研究团队还开发了一个代码驱动的合成管道,用于生成用于训练实例分割模型的像素级精确实例掩码,当将其集成到多模态定位框架中时,该模型在其基准测试中表现出色,并泛化到现实世界的图表定位任务。 AI
影响 增强了多模态模型在复杂图表可视化中解释和定位信息的能力。
排序理由 该集群包含一篇研究论文,介绍了一项特定人工智能任务的新基准和方法论。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →