研究人员开发了 Argus,一个专为视觉文档设计的新型检索系统。与生成静态文档嵌入的先前方法不同,Argus 使用区域感知的专家混合(MoE)模块创建查询条件化表示。这种方法允许系统根据特定查询调整文档表示,从而提高视觉文档检索任务的性能。Argus-9B 模型在 ViDoRe 排行榜上取得了最先进的成果,性能优于现有的开放后期交互模型。 AI
影响 推进视觉文档检索,可能改进 LLM 代理访问和处理复杂视觉文档信息的方式。
排序理由 这是一篇详细介绍新模型和基准测试结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →