DiffusionGemma 26B 在四块 AMD 7900 XTX GPU 上以 100 TPS 运行

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-11 15:18

一位 Reddit 用户分享了他们在四块 AMD 7900 XTX GPU 上运行 DiffusionGemma 26B 的经验。他们实现了高达每秒 100 个 token 的生成速度，考虑到提示处理，总体吞吐量为每秒 45-60 个 token。该用户详细介绍了用于为该特定硬件配置 vLLM 环境的 Docker 命令，并指出准备图像消耗了大量的 DeepSeek-V4-Pro token。 AI

影响展示了 DiffusionGemma 26B 在消费级 GPU 上的性能，为本地 LLM 部署提供了见解。

排序理由用户生成的关于在消费级硬件上运行特定模型的报告。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

DiffusionGemma 26B 在四块 AMD 7900 XTX GPU 上以 100 TPS 运行

报道来源 [1]

r/LocalLLaMA TIER_1 Français(FR) · /u/djdeniro · 2026-06-11 15:18

DifussionGemma 4 on 4x7900xtx

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u31zmk/difussiongemma_4_on_4x7900xtx/"> <img alt="DifussionGemma 4 on 4x7900xtx" src="https://preview.redd.it/qq3kr31q6o6h1.png?width=140&height=46&auto=webp&s=c6078221ad8c6af50dd258866dcbbf5e8db1…

报道来源 [1]

DifussionGemma 4 on 4x7900xtx

相关实体

相关话题