一位用户在 AMD Strix Halo APU 上对 Google 的 Gemma 4 模型进行了基准测试,特别是其量化感知训练 (QAT) 版本。测试使用了 llama.cpp 和 Vulkan/RADV 后端,评估了包括 12B、26B 和 31B 参数在内的不同模型大小的性能。用户详细说明了主机系统规格以及转换和加载 QAT 助手头以获得最佳性能的过程。 AI
影响 提供了在消费级 AMD 硬件上运行 Gemma 4 模型的性能数据,为潜在的部署策略提供信息。
排序理由 用户在特定硬件上对现有模型生成的基准测试。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →