PulseAugur
实时 17:01:32
English(EN) Gemma4-12B-QAT Uncensored Balanced is out with MTP (~60% speed boost)!

Gemma4-12B-QAT 无审查模型发布,速度提升 60%

Gemma4-12B-QAT 模型发布了一个新的无审查且平衡的版本,由于集成了用于推测性解码的多令牌预测 (MTP) 草稿头,速度有了显著提升,约 60%。该模型在综合基准测试中实现了零拒绝,并提供包括视觉支持在内的多模态能力。该模型针对创意写作和角色扮演进行了优化,而 Qwen3.6 在代理编码和工具使用方面被认为更优。 AI

影响 此次发布为本地 LLM 部署提供了一个更快、无审查的选项,有望改善创意和角色扮演应用中的用户体验。

排序理由 微调的开源模型发布。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Gemma4-12B-QAT 无审查模型发布,速度提升 60%

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/hauhau901 ·

    Gemma4-12B-QAT Uncensored Balanced is out with MTP (~60% speed boost)!

    <!-- SC_OFF --><div class="md"><p>First of all, I'm stoked to announce <strong>we are almost at 20 million downloads on HF!</strong> (counted only on my own account, no duplicates/quants/finetunes/etc) <strong>and almost 5000 members on Discord!</strong></p> <p><a href="https://h…