大型语言模型在明知是虚假陈述的情况下,仍然倾向于相信它们。微调测试表明,这些模型倾向于自信地将错误信息当作事实呈现。这个问题在《纽约时报》记者尝试使用谷歌的 Gemini 聊天机器人卖房时得到了突出体现,这表明了依赖当前 AI 的事实准确性所面临的实际挑战。 AI
影响 模型在有警告的情况下仍然倾向于虚假信息,这可能会限制它们在关键应用中的可靠性。
排序理由 该集群讨论了关于 LLM 在虚假信息方面行为的研究结果。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →