e5_large
PulseAugur coverage of e5_large — every cluster mentioning e5_large across labs, papers, and developer communities, ranked by signal.
- 2026-05-20 research_milestone A new research paper details the successful application of LLMs for automated psychiatric diagnosis classification, achieving a high F1 score. 来源
3 天有情绪数据
-
Google Embeddings 2 在检索基准测试中领先但速度较慢
一篇新论文对 Google Embeddings 2 (GE2) 与多个开源模型在多语言密集检索和 RAG 系统上的表现进行了基准测试。GE2 在包括 BEIR 和意大利语 RAG 语料库在内的多项任务中取得了最佳性能,但与本地模型相比,其延迟显著更高。Multilingual-E5-large (mE5-L) 在意大利语检索方面提供了相当的性能,但延迟低得多,使其成为对响应时间有严格要求的应用的更实用选择。
-
LLM以86.6%的准确率自动化精神疾病诊断分类
研究人员开发了一个自动化系统,利用自然语言处理(NLP)和机器学习(ML)对精神疾病诊断进行分类。该研究在一个包含超过145,000份西班牙语精神病描述的数据集上,评估了包括e5_large、BioLORD和Llama-3-8B等经典模型和大型语言模型(LLM)在内的各种文本表示方法。研究结果表明,基于Transformer的嵌入方法显著优于传统方法,经过微调的e5_large模型达到了0.866的最高F1分数。这项工作强调了将LLM…
-
乌克兰法院引用显示共引可预测性显著衰减
研究人员开发了一个新的基准 UA-StatuteRetrieval,用于评估法律信息系统中共引可预测性随时间的稳定性。通过分析 2007 年至 2026 年的 3.96 亿份乌克兰法院引用,他们发现检索性能显著衰减,可预测性下降高达 47%。虽然高频文章和刑事诉讼程序保持了稳定性,但中频文章和民事法律显示出明显的退化,部分原因在于 2017 年的司法改革和文章引用模式 4.3% 的语义变化。