r/LocalLLaMA 子版块的一名用户正在询问 mmproj 文件在 MTP(多轮提示)和非 MTP 模型之间的兼容性。他们具体想知道这些似乎与模型性能相关的文件的可互换使用性。该用户提供了 Qwen3.6-35B 模型的 mmproj 文件示例,并指出了 MTP 和非 MTP 变体之间 kv_count 的差异。 AI
排序理由 用户在特定社区论坛上对一个细微技术细节的提问。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
r/LocalLLaMA 子版块的一名用户正在询问 mmproj 文件在 MTP(多轮提示)和非 MTP 模型之间的兼容性。他们具体想知道这些似乎与模型性能相关的文件的可互换使用性。该用户提供了 Qwen3.6-35B 模型的 mmproj 文件示例,并指出了 MTP 和非 MTP 变体之间 kv_count 的差异。 AI
排序理由 用户在特定社区论坛上对一个细微技术细节的提问。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
<!-- SC_OFF --><div class="md"><p>I have not used MTP yet, are <code>mmproj</code> files different and could be speed up? Are they compatible between models MTP vs. non-MTP?</p> <p>E.g. <a href="https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/mmproj-BF16.gguf">https…