研究人员开发了一种方法,将人类大脑活动的情绪价映射到大型语言模型上。通过从大型语言模型的情绪表征中创建“V轴”,他们发现该轴与人类脑电图数据中的神经活动一致。虽然这种一致性很强,但标准的对齐技术并未提高大型语言模型解码情绪的能力,从而发现了“饱和度规律”,即进一步的监督会扭曲现有的表征。 AI
影响 表明大型语言模型可能捕捉到人类情绪处理的基本方面,可能为未来的人工智能对齐和认知科学研究提供信息。
排序理由 学术论文,详细介绍新颖的研究发现。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →