研究人员开发了一个名为CogWM的新型LLM框架,用于评估对话中的社会影响。该模型侧重于追踪用户内部认知状态的变化,如信念、欲望、意图和情绪,而不仅仅是表面文本指标。CogWM既充当用户模拟器,也充当评估平台,利用三层框架进行全面评估。该模型在超过150,000个用户回合样本上进行了训练,在预测情绪状态方面表现出更高的准确性,优于GPT-5.5。在区分试验中,CogWM成功地根据其认知影响识别出商业代理,其中Llama-4-Scout表现最佳。 AI
影响 这项研究引入了一种评估AI在对话中对人类认知状态影响的新方法,有望提高AI理解和影响用户能力。
排序理由 该集群包含一篇详细介绍新模型和评估框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →