一项新的基准测试显示,Google 的 Diffusion Gemma 模型虽然比其自回归模型速度显著更快,但事实错误也大幅增加。在涉及传记和历史记载的测试中,Diffusion Gemma 产生了 28 个错误,而 Gemma4 只有 5 个,在不太热门的主题上错误更为频繁。这种性能差异归因于 Diffusion Gemma 的令牌生成方法,该方法优先考虑流畅的输出而不是事实准确性,这是 Google 承认的一种权衡。 AI
影响 Diffusion Gemma 的速度优势是以显著的事实不准确为代价的,这表明输出流畅性和可靠性之间存在权衡。
排序理由 该集群包含比较两个 AI 模型的基准测试结果,突出了速度和准确性方面的性能差异。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →