研究人员推出Stellar,一个旨在使多模态文档检索对自然语言查询(NLQ)系统更具可扩展性的新框架。当前方法通常使用多个token级嵌入,这会导致高内存使用并阻碍实际部署。Stellar通过存储token级文档嵌入在磁盘上,并仅将一部分加载到内存中进行交互来解决这个问题。它通过一个两部分系统实现:基于词汇表示的过滤(LRF)用于高效候选集缩减,以及高效的磁盘备份后期交互(DLI)用于优化磁盘上存储和嵌入的动态加载。实验表明,Stellar在不牺牲检索效果的情况下,显著降低了内存开销和查询延迟。 AI
影响 该框架可以实现更高效、更具可扩展性的RAG系统部署,提高其在实际应用中的性能。
排序理由 该集群包含一篇详细介绍信息检索新技术的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →