PulseAugur
实时 04:21:38
English(EN) DocArena: Turning Raw Documents into Controllable Training Environments for Document Search Agents

DocArena 管道自动化文档搜索代理训练环境

研究人员开发了 DocArena,一个新颖的管道,可自动将原始文档集合转化为搜索代理的训练环境。该系统利用多模态大语言模型 (MLLMs) 进行视觉感知和问答对生成,无需人工标注。由此产生的 DocArena-79K 数据集包含跨越不同领域和语言的 8,000 多份文档,已用于训练 Doc-Search 代理。实验表明,在 DocArena 数据上训练的代理在检索准确性和问答质量方面均优于在基于文本的环境中训练的代理。 AI

影响 能够更高效、可扩展地训练多模态文档搜索代理,有望提高复杂文档集中的信息检索能力。

排序理由 这是一篇详细介绍 AI 代理训练新方法和数据集的研究论文。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

DocArena 管道自动化文档搜索代理训练环境

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Jiamian Wang, Ruiyi Zhang, Tong Yu, Jing Shi, Samyadeep Basu, Rajiv Jain, Zhiqiang Tao, Tong Sun ·

    DocArena: Turning Raw Documents into Controllable Training Environments for Document Search Agents

    arXiv:2606.26122v1 Announce Type: new Abstract: Recent methods train search agents via reinforcement learning from (question, answer, evidence) tuples without requiring expert trajectories. The tuples serve as the training environment, and whose properties directly shape what sea…