PulseAugur
实时 16:12:11
English(EN) Gemma 4 QAT Q4_0 Bench on Strix Halo

Gemma 4 QAT 模型在 AMD Strix Halo APU 上进行基准测试

一位用户在 AMD Strix Halo APU 上对 GoogleGemma 4 模型进行了基准测试,特别是其量化感知训练 (QAT) 版本。测试使用了 llama.cpp 和 Vulkan/RADV 后端,评估了包括 12B、26B 和 31B 参数在内的不同模型大小的性能。用户详细说明了主机系统规格以及转换和加载 QAT 助手头以获得最佳性能的过程。 AI

影响 提供了在消费级 AMD 硬件上运行 Gemma 4 模型的性能数据,为潜在的部署策略提供信息。

排序理由 用户在特定硬件上对现有模型生成的基准测试。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/westsunset ·

    Gemma 4 QAT Q4_0 在 Strix Halo 上进行基准测试

    <!-- SC_OFF --><div class="md"><h1>Gemma 4 QAT Q4_0 Bench on Strix Halo</h1> <p>These are Google's official Gemma 4 QAT Q4_0 GGUF models, served locally through llama.cpp Vulkan/RADV on a Strix Halo APU.</p> <p>QAT means <strong>quantization-aware training</strong>. Instead of ta…