PulseAugur
实时 23:54:38

Google Embeddings 2 在检索基准测试中领先但速度较慢

一篇新论文对 Google Embeddings 2 (GE2) 与多个开源模型在多语言密集检索和 RAG 系统上的表现进行了基准测试。GE2 在包括 BEIR 和意大利语 RAG 语料库在内的多项任务中取得了最佳性能,但与本地模型相比,其延迟显著更高。Multilingual-E5-large (mE5-L) 在意大利语检索方面提供了相当的性能,但延迟低得多,使其成为对响应时间有严格要求的应用的更实用选择。 AI

影响 强调了检索模型在尖端性能和延迟之间的权衡,指导实际部署选择。

排序理由 该集群包含一篇评估 AI 模型在特定基准测试上表现的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Stefano Cirillo, Domenico Desiato, Giuseppe Polese, Giandomenico Solimando ·

    Benchmarking Google Embeddings 2 against Open-Source Models for Multilingual Dense Retrieval and RAG Systems

    arXiv:2605.23618v1 Announce Type: new Abstract: We benchmark Google Embeddings (GE2), a Vertex-AI-hosted bi-encoder with 2,048-token context and explicit task-type conditioning, against five open-source alternatives: BGE-M3, E5-large, Multilingual-E5-large (mE5-L), LaBSE, and Par…

  2. arXiv cs.CL TIER_1 English(EN) · Giandomenico Solimando ·

    Benchmarking Google Embeddings 2 against Open-Source Models for Multilingual Dense Retrieval and RAG Systems

    We benchmark Google Embeddings (GE2), a Vertex-AI-hosted bi-encoder with 2,048-token context and explicit task-type conditioning, against five open-source alternatives: BGE-M3, E5-large, Multilingual-E5-large (mE5-L), LaBSE, and Paraphrase-Multilingual-MPNet (mMPNet). Evaluation …