一篇新的arXiv论文研究了开源大语言模型中情感向量的存在和出现,该研究建立在先前识别出Claude Sonnet 4.5中这些表示的工作之上。研究人员测试了Apertus-8B-Instruct-2509和Gemma-4-E4B-it,发现这两个模型都表现出效价几何,尽管其表示在模型深度上有所不同。发现唤醒编码对用于提取的语料库敏感,Gemma生成的故事情节显示出更强的对齐性。 AI
影响 这项研究可能有助于更深入地理解大语言模型如何处理和表示情感,并可能影响未来的模型开发和对齐策略。
排序理由 该集群包含一篇在arXiv上发表的学术论文,详细介绍了关于大语言模型内部表示的研究发现。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →