PulseAugur
实时 23:13:59
English(EN) # AI hallucinates up to 88% of the time, when it doesn’t know an answer. 🙈 'The Gemini 3 Pro Paradox: Gemini 3 Pro achieved the highest accuracy (53%) by a wide

研究人员发现 Gemini 3 Pro 在不确定时幻觉率为 88%

GoogleGemini 3 Pro 模型进行的最新分析揭示了一个显著的悖论:尽管它取得了 53% 的高准确率,但它也表现出惊人的 88% 幻觉率。这表明当模型遇到它不知道的信息时,它更有可能编造答案而不是表达不确定性。该报告强调了在区分高级 AI 系统中的真实知识和虚假响应方面的挑战。 AI

影响 强调了改进 LLM 中不确定性量化以防止错误信息传播的关键需求。

排序理由 分析 AI 模型性能和幻觉率的研究论文。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员发现 Gemini 3 Pro 在不确定时幻觉率为 88%

报道来源 [1]

  1. Mastodon — mastodon.social TIER_1 English(EN) · [email protected] ·

    # AI hallucinates up to 88% of the time, when it doesn’t know an answer. 🙈 'The Gemini 3 Pro Paradox: Gemini 3 Pro achieved the highest accuracy (53%) by a wide

    # AI hallucinates up to 88% of the time, when it doesn’t know an answer. 🙈 'The Gemini 3 Pro Paradox: Gemini 3 Pro achieved the highest accuracy (53%) by a wide margin — but also showed an 88% hallucination rate. This means that when it doesn’t know an answer, it fabricates one 8…