一篇新研究论文探讨了大型语言模型(LLMs)在对话中理解和标注人类心理状态的局限性。该研究引入了一个两步框架,LLMs首先识别面向任务的对话中的共同心智模型(SMM)元素,然后检测个体心智状态之间的差异。虽然LLMs在基本标注任务中表现出一致性,但研究发现它们在需要空间推理或区分韵律线索的场景中系统性地失败。 AI
影响 强调了在开发具有强大心智理论能力(对细致的人机交互至关重要)的LLMs方面持续存在的挑战。
排序理由 该集群包含一篇在arXiv上发表的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Cooperative Remote Search Task
- Hugging Face
- Katharine Kowalyshyn
- large language models
- theory of mind
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →