English(EN) LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

新研究表明注意力值能更好地捕捉LLM句子语义

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-12 04:00

一项新的研究论文提出，在大型语言模型（LLM）中，注意力值比隐藏状态更能有效地捕捉句子语义。该论文引入了值聚合（VA）方法，该方法跨层和跨索引聚合了token值，在无训练设置下优于现有的基于LLM的嵌入。一种改进技术，对齐加权VA（AlignedWVA），通过将层注意力输出解释为对齐的加权值向量，进一步提高了性能，并取得了最先进的结果。 AI

影响提出了一种从LLM生成更富含语义的句子嵌入的新方法，有望改进下游NLP应用。

排序理由学术论文，详细介绍了一种新颖的LLM嵌入方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Yeqin Zhang, Yunfei Wang, Jiaxuan Chen, Ke Qin, Yizheng Zhao, Cam-Tu Nguyen · 2026-06-12 04:00

LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

arXiv:2602.01572v2 Announce Type: replace Abstract: Sentence representations are foundational to many Natural Language Processing (NLP) applications. While recent methods leverage Large Language Models (LLMs) to derive sentence representations, most rely on final-layer hidden sta…

报道来源 [1]

LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

相关实体

相关话题