English(EN) Gemma 4 31B Q6 on Dual 9060 XT

Gemma 4 31B 模型在双 9060 XT GPU 上的性能受到质疑

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-22 08:18

Reddit r/LocalLLaMA 子版块的一名用户正在就 Gemma 4 31B Q6 模型在双 9060 XT 显卡上运行时遇到的性能问题寻求建议。用户报告称，推理速度稳定在每秒 8-9 个 token 左右，他们认为这比其他讨论中预期的要慢。用户认为当前速度尚可使用，但希望在可能忽略了任何优化的情况下找到改进的方法。 AI

影响有可能为拥有类似硬件配置的用户提高本地 LLM 推理速度。

排序理由用户层面关于在消费级硬件上优化特定模型的讨论。

在 r/LocalLLaMA 阅读 →

基础设施

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/beigepccase · 2026-06-22 08:18

Gemma 4 31B Q6 on Dual 9060 XT

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1ucenk7/gemma_4_31b_q6_on_dual_9060_xt/"> <img alt="Gemma 4 31B Q6 on Dual 9060 XT" src="https://preview.redd.it/2ytvy9njms8h1.jpeg?width=320&crop=smart&auto=webp&s=9e2294ed32265c1cc5b7b76961b4636e…

报道来源 [1]

Gemma 4 31B Q6 on Dual 9060 XT

相关实体

相关话题