PulseAugur
实时 10:09:05
English(EN) Querit-Reranker: Training Compact Multilingual Rerankers via Efficient Label-Free Distribution Adaptation

新型多语言重排模型高效训练,适用于多样化任务

研究人员开发了Querit-Reranker,这是一系列新的多语言交叉编码器重排模型,旨在无需大量标记数据即可高效适应各种排序任务。这些模型使用一种利用合成查询挖掘和教师分数作为软标签的流水线进行训练,并且可以合并检查点以创建单个可部署模型。Querit-Reranker-A0.4B在BEIR和MIRACL等基准测试中表现出显著的改进,而Querit-Reranker-4B在公开可用的模型中取得了最先进的性能。这两个模型都可以在Hugging Face上获取。 AI

影响 引入了一种更有效的方法来适应多语言重排模型,有可能降低部署高级搜索和检索系统的门槛。

排序理由 详细介绍新模型架构和训练方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Jiafeng Guo ·

    Querit-Reranker:通过高效无标签分布自适应训练紧凑型多语言重排模型

    Deployable multilingual rerankers must generalize across languages, domains, and target ranking tasks while remaining efficient enough for second-stage reranking. However, adapting them to new target distributions typically requires extensive task-specific relevance annotations, …