研究人员开发了Querit-Reranker,这是一系列新的多语言交叉编码器重排模型,旨在无需大量标记数据即可高效适应各种排序任务。这些模型使用一种利用合成查询挖掘和教师分数作为软标签的流水线进行训练,并且可以合并检查点以创建单个可部署模型。Querit-Reranker-A0.4B在BEIR和MIRACL等基准测试中表现出显著的改进,而Querit-Reranker-4B在公开可用的模型中取得了最先进的性能。这两个模型都可以在Hugging Face上获取。 AI
影响 引入了一种更有效的方法来适应多语言重排模型,有可能降低部署高级搜索和检索系统的门槛。
排序理由 详细介绍新模型架构和训练方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
- BEIR
- Hugging Face
- MTEB Multilingual v2 Reranking
- Querit-Reranker
- Querit-Reranker-4B
- Querit-Reranker-A0.4B
- Qwen3-Embedding-0.6B
- Qwen3-Embedding-4B
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →