PulseAugur
实时 19:33:15

DiffusionGemma 26B 在四块 AMD 7900 XTX GPU 上以 100 TPS 运行

一位 Reddit 用户分享了他们在四块 AMD 7900 XTX GPU 上运行 DiffusionGemma 26B 的经验。他们实现了高达每秒 100 个 token 的生成速度,考虑到提示处理,总体吞吐量为每秒 45-60 个 token。该用户详细介绍了用于为该特定硬件配置 vLLM 环境的 Docker 命令,并指出准备图像消耗了大量的 DeepSeek-V4-Pro token。 AI

影响 展示了 DiffusionGemma 26B 在消费级 GPU 上的性能,为本地 LLM 部署提供了见解。

排序理由 用户生成的关于在消费级硬件上运行特定模型的报告。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

DiffusionGemma 26B 在四块 AMD 7900 XTX GPU 上以 100 TPS 运行

报道来源 [1]

  1. r/LocalLLaMA TIER_1 Français(FR) · /u/djdeniro ·

    DifussionGemma 4 on 4x7900xtx

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u31zmk/difussiongemma_4_on_4x7900xtx/"> <img alt="DifussionGemma 4 on 4x7900xtx" src="https://preview.redd.it/qq3kr31q6o6h1.png?width=140&amp;height=46&amp;auto=webp&amp;s=c6078221ad8c6af50dd258866dcbbf5e8db1…