English(EN) miniReranker: Efficient Multimodal Reranking through Visual Cache Reuse and Interaction Sparsity

新型miniReranker提升了MLLM重排效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 12:11

研究人员开发了miniReranker，这是一种新颖的方法，可提高多模态大型语言模型（MLLM）作为重排器时的效率。该系统将标准的查询优先公式重新配置为视觉优先方法，从而增强了缓存重用和重排性能。miniReranker通过早期退出、限制跨段注意力以及修剪视觉标记来减少活动参数，从而进一步优化性能，在高度重用场景下实现了超过96%的密集模型性能，同时将运行时间减少到1%以下。 AI

影响提高了多模态AI系统的效率，可能加速搜索和推荐应用。

排序理由该集群包含一篇详细介绍新模型架构及其性能改进的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Xiaoyu Shen · 2026-06-09 12:11

miniReranker：通过视觉缓存重用和交互稀疏性实现高效多模态重排

Multimodal large language models (MLLMs) have recently shown strong potential as point-wise rerankers by directly modeling query--document relevance through next-token prediction. However, point-wise reranking suffers from substantial repeated computation across query--document p…

报道来源 [1]

miniReranker：通过视觉缓存重用和交互稀疏性实现高效多模态重排

相关实体

相关话题