English(EN) MARDoc: A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA

MARDoc框架通过结构化记忆增强多模态长文档问答能力

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-04 06:23

研究人员推出了一种新颖的框架MARDoc，旨在改进长篇多模态文档的问答能力。该系统使用三个专门的代理：用于检索的Explorer，用于将交互处理成结构化记忆的Refiner，以及用于反馈的Reflector。通过采用动态结构化记忆而非持续增长的上下文，MARDoc旨在减少噪声并保留关键信息，以实现更有效的多跳推理。 AI

影响引入了一种处理复杂多模态文档的新方法，有望提高AI处理和推理广泛信息的能力。

排序理由该集群描述了一篇详细介绍特定AI任务新颖框架的研究论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Kaifeng Chen, Hongtao Liu, Qiyao Peng, Jian Yang, Yongqiang Liu, Xiaochen Zhang, Qing Yang · 2026-06-05 04:00

MARDoc：用于多模态长文档问答的记忆感知精炼代理框架

arXiv:2606.05749v1 Announce Type: new Abstract: Iterative retrieval-reasoning agents have recently shown promise for multimodal long-document question answering. However, most existing systems maintain a single growing context that mixes retrieval traces, observations, and interm…
Hugging Face Daily Papers TIER_1 English(EN) · 2026-06-04 06:23

MARDoc：用于多模态长文档问答的记忆感知精炼代理框架

Iterative retrieval-reasoning agents have recently shown promise for multimodal long-document question answering. However, most existing systems maintain a single growing context that mixes retrieval traces, observations, and intermediate reasoning. As interactions accumulate, ke…

报道来源 [2]

MARDoc：用于多模态长文档问答的记忆感知精炼代理框架

MARDoc：用于多模态长文档问答的记忆感知精炼代理框架

相关实体

相关话题