PulseAugur
实时 09:43:16
English(EN) Mean-Pooled Cosine Similarity is Not Length-Invariant: Theory and Cross-Domain Evidence for a Length-Invariant Alternative

论文挑战神经网络表示的余弦相似度指标

一篇新发表在arXiv上的论文认为,用于比较神经网络表示的常用指标——均值池化余弦相似度——并非长度不变的。研究人员证明,仅序列长度就可能严重影响该指标,从而可能扭曲跨语言和跨模态比较的结果。他们提出使用中心核对齐(CKA)作为一种更鲁棒、长度不变的替代方案来评估表示相似度。 AI

影响 挑战了常用评估指标的有效性,可能影响模型性能的评估和比较方式。

排序理由 提出一种评估神经网络表示新方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

论文挑战神经网络表示的余弦相似度指标

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Dhruv Kumar ·

    Mean-Pooled Cosine Similarity is Not Length-Invariant: Theory and Cross-Domain Evidence for a Length-Invariant Alternative

    Mean-pooled cosine similarity is the default metric for comparing neural representations across languages, modalities, and tasks. We establish that this metric is not length-invariant: under the anisotropy that characterizes modern transformer representations, mean-pooled cosine …

  2. Medium — MCP tag TIER_1 English(EN) · WebWizardsSG ·

    How RAG Uses Cosine Similarity — And Why It Matters

    <div class="medium-feed-item"><p class="medium-feed-image"><a href="https://medium.com/@yanguangchensp/how-rag-uses-cosine-similarity-and-why-it-matters-87e97987f6b5?source=rss------mcp-5"><img src="https://cdn-images-1.medium.com/max/1600/0*S1lv5Y7ZjTqBpot4.jpg" width="1600" /><…