English(EN) Gemma4-12B-QAT Uncensored Balanced is out with MTP (~60% speed boost)!

Gemma4-12B-QAT 无审查模型发布，速度提升 60%

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-22 15:11

Gemma4-12B-QAT 模型发布了一个新的无审查且平衡的版本，由于集成了用于推测性解码的多令牌预测 (MTP) 草稿头，速度有了显著提升，约 60%。该模型在综合基准测试中实现了零拒绝，并提供包括视觉支持在内的多模态能力。该模型针对创意写作和角色扮演进行了优化，而 Qwen3.6 在代理编码和工具使用方面被认为更优。 AI

影响此次发布为本地 LLM 部署提供了一个更快、无审查的选项，有望改善创意和角色扮演应用中的用户体验。

排序理由微调的开源模型发布。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/hauhau901 · 2026-06-22 15:11

Gemma4-12B-QAT Uncensored Balanced is out with MTP (~60% speed boost)!

<div class="md">First of all, I'm stoked to announce we are almost at 20 million downloads on HF! (counted only on my own account, no duplicates/quants/finetunes/etc) and almost 5000 members on Discord! <a href="https://h…

报道来源 [1]

Gemma4-12B-QAT Uncensored Balanced is out with MTP (~60% speed boost)!

相关实体

相关话题