宾夕法尼亚州立大学的一项研究发现,LLM 产生错误答案的几率为 50%。在涉及 9,500 多次测试的实验中,参与者在 80% 的情况下接受了这些错误答案,即使答案是错误的,对 LLM 回复的信心也会增加。经济激励略微提高了准确性,而紧迫感则降低了准确性。 AI
影响 凸显了过度依赖 LLM 的风险,影响用户信任和决策。
排序理由 关于 LLM 行为和用户交互的学术研究。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →