PulseAugur
实时 14:02:09
English(EN) Gemma 4 31B Q6 on Dual 9060 XT

Gemma 4 31B 模型在双 9060 XT GPU 上的性能受到质疑

Reddit r/LocalLLaMA 子版块的一名用户正在就 Gemma 4 31B Q6 模型在双 9060 XT 显卡上运行时遇到的性能问题寻求建议。用户报告称,推理速度稳定在每秒 8-9 个 token 左右,他们认为这比其他讨论中预期的要慢。用户认为当前速度尚可使用,但希望在可能忽略了任何优化的情况下找到改进的方法。 AI

影响 有可能为拥有类似硬件配置的用户提高本地 LLM 推理速度。

排序理由 用户层面关于在消费级硬件上优化特定模型的讨论。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Gemma 4 31B 模型在双 9060 XT GPU 上的性能受到质疑

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/beigepccase ·

    Gemma 4 31B Q6 on Dual 9060 XT

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1ucenk7/gemma_4_31b_q6_on_dual_9060_xt/"> <img alt="Gemma 4 31B Q6 on Dual 9060 XT" src="https://preview.redd.it/2ytvy9njms8h1.jpeg?width=320&amp;crop=smart&amp;auto=webp&amp;s=9e2294ed32265c1cc5b7b76961b4636e…