对 Google AI Overviews 的一项最新分析显示,尽管模型在 SimpleQA 等基准测试中表现出高准确率,但相当一部分“正确”答案并未得到引文来源的支持。这种模型声明与其支持证据之间的差异在 Gemini 2 和 Gemini 3 之间从 37% 上升到 56%,表明 AI 搜索产品在信息综合方式上存在结构性问题。即使模型升级,这个问题依然存在,这表明在确保 AI 生成的摘要忠实反映其来源材料方面存在根本性挑战。 AI
影响 凸显了 AI 搜索产品的一个关键缺陷,即事实准确性因来源依据不足而受到损害,可能误导用户。
排序理由 对某产品性能及其对 AI 搜索类别的启示进行分析。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →