English(EN) Layer-wise Token Compression for Efficient Document Reranking

新的逐层令牌压缩技术提升文档重排速度

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-20 03:52

研究人员开发了一种名为逐层令牌压缩（LTC）的新方法，以提高信息检索中使用的基于Transformer的文档重排模型的效率。与仅应用于初始嵌入层的先前令牌压缩技术不同，LTC在中间Transformer层调整令牌池化。这种方法在速度上显示出显著提升，将passage ranking的每秒推理查询数提高了高达25%，将document ranking的每秒推理查询数提高了116%，同时保持了重排质量。该方法也适用于长上下文列表式重排，甚至可能作为长文档任务的有益正则化器。 AI

影响提高了信息检索系统的效率，可能带来更快的搜索结果和更好的长文档处理能力。

排序理由该集群包含一篇学术论文，详细介绍了一种提高AI模型效率的新方法。

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Ivano Lauriola · 2026-05-20 03:52

面向高效文档重排的层级化Token压缩

Transformer-based document cross-encoder rerankers are a central component of modern information retrieval systems. Despite their success, these models suffer from high computational costs due to processing long query-document sequences at inference time. A known approach to impr…

报道来源 [1]

面向高效文档重排的层级化Token压缩

相关话题