PulseAugur
实时 18:37:12
English(EN) Where Do Models Find Happiness? Emotion Vectors in Open-Source LLMs

在开源大语言模型Apertus和Gemma中发现情感向量

一篇新的arXiv论文研究了开源大语言模型中情感向量的存在和出现,该研究建立在先前识别出Claude Sonnet 4.5中这些表示的工作之上。研究人员测试了Apertus-8B-Instruct-2509和Gemma-4-E4B-it,发现这两个模型都表现出效价几何,尽管其表示在模型深度上有所不同。发现唤醒编码对用于提取的语料库敏感,Gemma生成的故事情节显示出更强的对齐性。 AI

影响 这项研究可能有助于更深入地理解大语言模型如何处理和表示情感,并可能影响未来的模型开发和对齐策略。

排序理由 该集群包含一篇在arXiv上发表的学术论文,详细介绍了关于大语言模型内部表示的研究发现。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

在开源大语言模型Apertus和Gemma中发现情感向量

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Sinie van der Ben, Rapha\"el Baur, Yannick Metz, Mennatallah El-Assady ·

    Where Do Models Find Happiness? Emotion Vectors in Open-Source LLMs

    arXiv:2606.26987v1 Announce Type: cross Abstract: Recent work identified emotion vectors in Claude Sonnet 4.5, which are internal representations that encode emotion concepts, causally influence behavior, and exhibit geometry mirroring human psychological structure. We test the g…

  2. arXiv cs.AI TIER_1 English(EN) · Mennatallah El-Assady ·

    Where Do Models Find Happiness? Emotion Vectors in Open-Source LLMs

    Recent work identified emotion vectors in Claude Sonnet 4.5, which are internal representations that encode emotion concepts, causally influence behavior, and exhibit geometry mirroring human psychological structure. We test the generality of these findings in two open-weight mod…