English(EN) Worse quality with MTP - Qwen 3.6, Gemma 4

MTP 功能降低了 Qwen 3.6 和 Gemma 4 模型的输出质量

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-25 07:10

一位 Reddit r/LocalLLaMA 用户报告称，在使用 MTP（多轮处理）功能时，Qwen 3.6 和 Gemma 4 模型的输出质量显著下降。尽管 MTP 提供了更高的 token 生成速度，但用户发现非 MTP 版本通常用更少的 token 生成了更全面、更有用的代码审查结果。这与 MTP 在不牺牲质量的情况下提供性能提升的普遍认知相悖，促使用户寻求其他人的类似经历。 AI

影响表明 MTP 的实现可能存在问题，影响了特定模型的性能和质量。

排序理由用户关于特定功能模型性能的报告。

在 r/LocalLLaMA 阅读 →

模型发布

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/Significant_Bar_460 · 2026-06-25 07:10

Worse quality with MTP - Qwen 3.6, Gemma 4

<div class="md">Hi. I am self-hosting Qwen 3.6 27B Q8_K_XL with Llama.cpp on 4x5070ti. (All 4 cards are on single x16 slot bifurcated to 4x4 with risers). I've been testing it on several work repos with Opencode CLI and in like 8/10 situations…

报道来源 [1]

Worse quality with MTP - Qwen 3.6, Gemma 4

相关实体

相关话题