研究人员推出了 Chameleon,这是一个包含 5,001 个上下文心理画像的数据集,源自 1,667 名 Reddit 用户,旨在捕捉用户在多个交互上下文中的状态和特质。他们的研究结果表明,用户行为主要受状态(74%)而非特质(26%)的影响。该研究还发现,当前的大型语言模型是状态盲的,只关注用户特质,未能根据当前的交互上下文调整响应。此外,奖励模型对用户状态表现出不一致的反应,有时偏袒同一用户,有时又惩罚他们。 AI
影响 这项研究突显了当前 LLM 的一个关键局限性,表明需要能够适应动态用户状态的模型,以实现更个性化和有效的交互。
排序理由 这是一篇介绍新数据集和 LLM 行为研究的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →