(CA) Stellar: Scalable Multimodal Document Retrieval for Natural Language Queries

Stellar框架增强多模态文档检索可扩展性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 08:57

研究人员推出Stellar，一个旨在使多模态文档检索对自然语言查询（NLQ）系统更具可扩展性的新框架。当前方法通常使用多个token级嵌入，这会导致高内存使用并阻碍实际部署。Stellar通过存储token级文档嵌入在磁盘上，并仅将一部分加载到内存中进行交互来解决这个问题。它通过一个两部分系统实现：基于词汇表示的过滤（LRF）用于高效候选集缩减，以及高效的磁盘备份后期交互（DLI）用于优化磁盘上存储和嵌入的动态加载。实验表明，Stellar在不牺牲检索效果的情况下，显著降低了内存开销和查询延迟。 AI

影响该框架可以实现更高效、更具可扩展性的RAG系统部署，提高其在实际应用中的性能。

排序理由该集群包含一篇详细介绍信息检索新技术的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.IR (Information Retrieval) TIER_1 (CA) · Yunjun Gao · 2026-06-18 08:57

Stellar：面向自然语言查询的可扩展多模态文档检索

Multimodal document retrieval--selecting the most relevant multimodal document from a large corpus to answer a natural language query--plays an essential role in Retrieval-Augmented Generation (RAG) systems. State-of-the-art methods represent each document and query with multiple…

报道来源 [1]

Stellar：面向自然语言查询的可扩展多模态文档检索

相关实体

相关话题