PulseAugur
实时 02:19:16
English(EN) Worse quality with MTP - Qwen 3.6, Gemma 4

MTP 功能降低了 Qwen 3.6 和 Gemma 4 模型的输出质量

一位 Reddit r/LocalLLaMA 用户报告称,在使用 MTP(多轮处理)功能时,Qwen 3.6Gemma 4 模型的输出质量显著下降。尽管 MTP 提供了更高的 token 生成速度,但用户发现非 MTP 版本通常用更少的 token 生成了更全面、更有用的代码审查结果。这与 MTP 在不牺牲质量的情况下提供性能提升的普遍认知相悖,促使用户寻求其他人的类似经历。 AI

影响 表明 MTP 的实现可能存在问题,影响了特定模型的性能和质量。

排序理由 用户关于特定功能模型性能的报告。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

MTP 功能降低了 Qwen 3.6 和 Gemma 4 模型的输出质量

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/Significant_Bar_460 ·

    Worse quality with MTP - Qwen 3.6, Gemma 4

    <!-- SC_OFF --><div class="md"><p>Hi.<br /> I am self-hosting Qwen 3.6 27B Q8_K_XL with Llama.cpp on 4x5070ti.<br /> (All 4 cards are on single x16 slot bifurcated to 4x4 with risers).</p> <p>I've been testing it on several work repos with Opencode CLI and in like 8/10 situations…