English(EN) Mean-Pooled Cosine Similarity is Not Length-Invariant: Theory and Cross-Domain Evidence for a Length-Invariant Alternative

论文挑战神经网络表示的余弦相似度指标

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-08 06:48

一篇新发表在arXiv上的论文认为，用于比较神经网络表示的常用指标——均值池化余弦相似度——并非长度不变的。研究人员证明，仅序列长度就可能严重影响该指标，从而可能扭曲跨语言和跨模态比较的结果。他们提出使用中心核对齐（CKA）作为一种更鲁棒、长度不变的替代方案来评估表示相似度。 AI

影响挑战了常用评估指标的有效性，可能影响模型性能的评估和比较方式。

排序理由提出一种评估神经网络表示新方法的学术论文。

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Dhruv Kumar · 2026-05-08 06:48

均值池化余弦相似度并非长度不变：理论与跨域证据表明存在长度不变的替代方案

Mean-pooled cosine similarity is the default metric for comparing neural representations across languages, modalities, and tasks. We establish that this metric is not length-invariant: under the anisotropy that characterizes modern transformer representations, mean-pooled cosine …
Medium — MCP tag TIER_1 English(EN) · WebWizardsSG · 2026-05-11 09:07

RAG 如何使用余弦相似度 — 及其重要性

<div class="medium-feed-item"><p class="medium-feed-image"><a href="https://medium.com/@yanguangchensp/how-rag-uses-cosine-similarity-and-why-it-matters-87e97987f6b5?source=rss------mcp-5"><img src="https://cdn-images-1.medium.com/max/1600/0*S1lv5Y7ZjTqBpot4.jpg" width="1600" /><…