新研究强调了LLM在理解人类心理状态方面的局限性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

一篇新研究论文探讨了大型语言模型（LLMs）在对话中理解和标注人类心理状态的局限性。该研究引入了一个两步框架，LLMs首先识别面向任务的对话中的共同心智模型（SMM）元素，然后检测个体心智状态之间的差异。虽然LLMs在基本标注任务中表现出一致性，但研究发现它们在需要空间推理或区分韵律线索的场景中系统性地失败。 AI

影响强调了在开发具有强大心智理论能力（对细致的人机交互至关重要）的LLMs方面持续存在的挑战。

排序理由该集群包含一篇在arXiv上发表的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Katharine Kowalyshyn, Matthias Scheutz · 2026-06-30 04:00

LLMs and their Limited Theory of Mind: Evaluating Mental State Annotations in Situated Dialogue

arXiv:2509.02292v2 Announce Type: replace Abstract: What if large language models could not only infer human mindsets but also expose every blind spot in team dialogue such as discrepancies in the team members' joint understanding? We present a novel, two-step framework that leve…

报道来源 [1]

LLMs and their Limited Theory of Mind: Evaluating Mental State Annotations in Situated Dialogue

相关实体

相关话题