实体 Cross-Encoder

Cross-Encoder

PulseAugur coverage of Cross-Encoder — every cluster mentioning Cross-Encoder across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 5

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 5 条

TOOL · CL_176193 · Aug 1 · 11:27

Kmemo 2.0 语义缓存弥补性能差距，可与 GPTCache 媲美

Kmemo 2.0，一个用于 LLM 调用的语义缓存，已发布，解决了之前确定的两个不足之处。第一个不足之处是关于其验证器模型的有效性，现已量化：它阻止了初始守卫遗漏的大量近乎匹配和释义。第二个不足之处是与自建基线的比较，现已更新为包含与 GPTCache 的比较。虽然 Kmemo 的词汇链最初表现强劲，但 GPTCache 的 ONNX 交叉编码器在减少误报方面被证明更有效，尽管代价是拒绝了更多真实的改写。
RESEARCH · CL_92664 · Jun 15 · 21:00

RAG管道：从BM25到重排以提高AI助手准确性

一位开发者详细介绍了为集成到基于Go的任务队列系统中的AI助手构建检索增强生成（RAG）管道的过程。最初的实现使用了ChromaDB进行向量搜索，但由于在Hugging Face Spaces上部署出现问题，它被替换为内存中的BM25算法，以实现更快、更简单的检索。另一篇文章讨论了重排在RAG系统中的重要性，认为虽然初始检索速度很快，但第二个交叉编码器步骤对于通过重新评估候选文档来提高准确性至关重要。这个重排过程，无论是使用Coher…
RESEARCH · CL_56161 · May 26 · 20:16

新AI系统利用语义检索增强职位推荐

研究人员开发了一个新的职位推荐系统，该系统结合了基于关键字和语义检索技术来提高准确性。该系统利用职位名称、公司和地点等结构化元数据，无需完整的职位描述或用户历史记录。在超过31,000个LinkedIn职位发布的数据集上进行的实验表明，混合方法在Precision@10得分上达到了0.8032，在nDCG@10得分上达到了0.9496，并且通过一个Cross-Encoder重排组件进一步得到了改进。
TOOL · CL_39077 · May 19 · 00:00

Hugging Face 发布 Ettin Reranker 模型以改进搜索

Hugging Face 发布了一个新的六个 Ettin Reranker 模型系列，这些模型构建在 Ettin ModernBERT 编码器之上。这些模型在其各自的尺寸下提供了最先进的性能，并专为信息检索系统中的检索后重排模式而设计。此次发布包括模型、它们的训练数据以及完整的训练配方，使用户能够集成它们，甚至训练自己的重排模型。
TOOL · CL_33760 · May 15 · 20:13

修复本地 LLM 知识库需要更好的检索，而非新模型

设置本地 LLM 知识库通常会产生糟糕的结果，这是由于检索管道中的问题，而非模型本身。常见问题包括不充分的分块，导致句子被分割或不相关的内容被分组；使用未能捕捉特定领域语义细微差别的嵌入模型；以及检索到的块太少，无法重建必要的上下文。解决方案包括使用具有重叠和语义边界的递归分割器以获得更好的分块；测试各种嵌入模型，如 BAAI/bge-base-en-v1.5 或 intfloat/e5-base-v2，以找到适合数据的模型；以及增加…