English(EN) Chain of Evidence: Pixel-Level Visual Attribution for Iterative Retrieval-Augmented Generation

Chain of Evidence 框架实现了检索增强生成的像素级视觉归因

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了一个名为 Chain of Evidence (CoE) 的新框架，以改进迭代检索增强生成 (iRAG) 系统。CoE 利用视觉语言模型直接分析检索到的文档的屏幕截图，实现精确的像素级归因，克服了纯文本解析的局限性。该方法旨在增强对演示文稿幻灯片和图表等视觉丰富文档的推理能力，保留空间逻辑和布局线索。 AI

影响该框架可以增强 AI 对复杂视觉文档进行推理的能力，提高需要布局和空间理解的任务的准确性。

排序理由这是一篇介绍新框架和数据集以改进检索增强生成系统的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Peiyang Liu, Ziqiang Cui, Xi Wang, Di Liang, Wei Ye · 2026-05-05 04:00

证据链：像素级视觉归因用于迭代检索增强生成

arXiv:2605.01284v1 Announce Type: new Abstract: Iterative Retrieval-Augmented Generation (iRAG) has emerged as a powerful paradigm for answering complex multi-hop questions by progressively retrieving and reasoning over external documents. However, current systems predominantly o…

报道来源 [1]

证据链：像素级视觉归因用于迭代检索增强生成

相关实体

相关话题