一项新的研究论文提出,在大型语言模型(LLM)中,注意力值比隐藏状态更能有效地捕捉句子语义。该论文引入了值聚合(VA)方法,该方法跨层和跨索引聚合了token值,在无训练设置下优于现有的基于LLM的嵌入。一种改进技术,对齐加权VA(AlignedWVA),通过将层注意力输出解释为对齐的加权值向量,进一步提高了性能,并取得了最先进的结果。 AI
影响 提出了一种从LLM生成更富含语义的句子嵌入的新方法,有望改进下游NLP应用。
排序理由 学术论文,详细介绍了一种新颖的LLM嵌入方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →