English(EN) CompRank: Efficient LLM Reranking via Token-Level Compression and Decoding-Free Scoring

CompRank框架提升LLM重排效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 06:23

研究人员开发了CompRank，一个旨在提高大型语言模型（LLM）重排器在信息检索任务中计算效率的新框架。CompRank通过令牌级压缩和无解码评分方法减少冗余计算来实现这一目标。实验表明，CompRank在保持高性能的同时显著加快了重排速度，使得基于LLM的重排能够更有效地处理长候选列表。 AI

影响这项研究提供了一种更高效的LLM重排方法，有望使其在检索系统中得到更广泛的应用。

排序理由该集群包含一篇详细介绍提高LLM效率新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Xiaoyu Shen · 2026-06-10 06:23

CompRank：通过令牌级压缩和无解码评分实现高效 LLM 重排序

Large language model (LLM) rerankers have become an important component of modern retrieval and retrieval-augmented generation pipelines, but their high computational cost limits their applicability to long candidate lists. In this paper, we propose \textbf{CompRank}, a token-eff…