Gemma4-12B-QAT 模型发布了一个新的无审查且平衡的版本,由于集成了用于推测性解码的多令牌预测 (MTP) 草稿头,速度有了显著提升,约 60%。该模型在综合基准测试中实现了零拒绝,并提供包括视觉支持在内的多模态能力。该模型针对创意写作和角色扮演进行了优化,而 Qwen3.6 在代理编码和工具使用方面被认为更优。 AI
影响 此次发布为本地 LLM 部署提供了一个更快、无审查的选项,有望改善创意和角色扮演应用中的用户体验。
排序理由 微调的开源模型发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →