研究人员开发了 DocArena,一个新颖的管道,可自动将原始文档集合转化为搜索代理的训练环境。该系统利用多模态大语言模型 (MLLMs) 进行视觉感知和问答对生成,无需人工标注。由此产生的 DocArena-79K 数据集包含跨越不同领域和语言的 8,000 多份文档,已用于训练 Doc-Search 代理。实验表明,在 DocArena 数据上训练的代理在检索准确性和问答质量方面均优于在基于文本的环境中训练的代理。 AI
影响 能够更高效、可扩展地训练多模态文档搜索代理,有望提高复杂文档集中的信息检索能力。
排序理由 这是一篇详细介绍 AI 代理训练新方法和数据集的研究论文。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →