Xiaoyun Yin 的一篇新论文认为,当研究人员讨论AI的“心智模型”或“心智理论”时,他们常常将复杂的模式匹配误解为真正的认知。该论文认为,目前显示大型语言模型在人类认知任务上表现良好的评估,仅仅证明了行为模仿。Yin 提议将分析重点从孤立地测试AI转移到分析人与AI之间的互动动态。 AI
影响 挑战了当前AI认知的基准,表明需要新的、侧重于人机交互的评估框架。
排序理由 讨论AI能力和评估方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →