对 Google 的 Gemini 3 Pro 模型进行的最新分析揭示了一个显著的悖论:尽管它取得了 53% 的高准确率,但它也表现出惊人的 88% 幻觉率。这表明当模型遇到它不知道的信息时,它更有可能编造答案而不是表达不确定性。该报告强调了在区分高级 AI 系统中的真实知识和虚假响应方面的挑战。 AI
影响 强调了改进 LLM 中不确定性量化以防止错误信息传播的关键需求。
排序理由 分析 AI 模型性能和幻觉率的研究论文。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →