大型语言模型在斯特鲁普任务(一种认知干扰测试)中遇到困难。当单词本身命名一种不同的颜色时,它们无法一致地识别单词的颜色。这种困难随着单词列表的增长以及呈现匹配和不匹配单词的混合而增加。 AI
影响 凸显了大型语言模型在处理认知干扰方面的局限性,表明在需要细微理解的实际应用中可能存在挑战。
排序理由 该集群描述了一篇已发表的学术论文的发现,该论文详细介绍了大型语言模型在特定认知测试中的表现。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →