一篇新发表在arXiv上的论文认为,用于比较神经网络表示的常用指标——均值池化余弦相似度——并非长度不变的。研究人员证明,仅序列长度就可能严重影响该指标,从而可能扭曲跨语言和跨模态比较的结果。他们提出使用中心核对齐(CKA)作为一种更鲁棒、长度不变的替代方案来评估表示相似度。 AI
影响 挑战了常用评估指标的有效性,可能影响模型性能的评估和比较方式。
排序理由 提出一种评估神经网络表示新方法的学术论文。
- arXiv
- CLIP ViT-B/32
- HumanEvalPack
- Mean-pooled cosine similarity
- Mistral-7B
- Centered Kernel Alignment (CKA)
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →