PulseAugur
实时 08:25:46
(CA) Stellar: Scalable Multimodal Document Retrieval for Natural Language Queries

Stellar框架增强多模态文档检索可扩展性

研究人员推出Stellar,一个旨在使多模态文档检索对自然语言查询(NLQ)系统更具可扩展性的新框架。当前方法通常使用多个token级嵌入,这会导致高内存使用并阻碍实际部署。Stellar通过存储token级文档嵌入在磁盘上,并仅将一部分加载到内存中进行交互来解决这个问题。它通过一个两部分系统实现:基于词汇表示的过滤(LRF)用于高效候选集缩减,以及高效的磁盘备份后期交互(DLI)用于优化磁盘上存储和嵌入的动态加载。实验表明,Stellar在不牺牲检索效果的情况下,显著降低了内存开销和查询延迟。 AI

影响 该框架可以实现更高效、更具可扩展性的RAG系统部署,提高其在实际应用中的性能。

排序理由 该集群包含一篇详细介绍信息检索新技术的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Stellar框架增强多模态文档检索可扩展性

报道来源 [1]

  1. arXiv cs.IR (Information Retrieval) TIER_1 (CA) · Yunjun Gao ·

    Stellar:面向自然语言查询的可扩展多模态文档检索

    Multimodal document retrieval--selecting the most relevant multimodal document from a large corpus to answer a natural language query--plays an essential role in Retrieval-Augmented Generation (RAG) systems. State-of-the-art methods represent each document and query with multiple…