English(EN) Gemma 4 QAT Q4_0 Bench on Strix Halo

Gemma 4 QAT 模型在 AMD Strix Halo APU 上进行基准测试

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-06 14:22

一位用户在 AMD Strix Halo APU 上对 Google 的 Gemma 4 模型进行了基准测试，特别是其量化感知训练 (QAT) 版本。测试使用了 llama.cpp 和 Vulkan/RADV 后端，评估了包括 12B、26B 和 31B 参数在内的不同模型大小的性能。用户详细说明了主机系统规格以及转换和加载 QAT 助手头以获得最佳性能的过程。 AI

影响提供了在消费级 AMD 硬件上运行 Gemma 4 模型的性能数据，为潜在的部署策略提供信息。

排序理由用户在特定硬件上对现有模型生成的基准测试。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/westsunset · 2026-06-06 14:22

Gemma 4 QAT Q4_0 在 Strix Halo 上进行基准测试

<div class="md"><h1>Gemma 4 QAT Q4_0 Bench on Strix Halo</h1> <p>These are Google's official Gemma 4 QAT Q4_0 GGUF models, served locally through llama.cpp Vulkan/RADV on a Strix Halo APU.</p> <p>QAT means <strong>quantization-aware training</strong>. Instead of ta…

报道来源 [1]

Gemma 4 QAT Q4_0 在 Strix Halo 上进行基准测试

相关实体

相关话题