English(EN) Holy crap y'all, gemma4:26b-a4b-it-qat runs at 15 tokens per second on this Nvidia 4070, 8 GB VRAM, 16 GB RAM, Windows 11, almost as fast as the 12B model! What

Gemma 4:26b-a4b-it-qat 模型在消费级 GPU 上实现每秒 15 个 token 的性能

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-21 18:32

一位用户报告称，gemma4:26b-a4b-it-qat 模型在配备 8GB 显存和 16GB 内存的 Nvidia 4070 GPU 上达到了每秒 15 个 token 的速度。该性能在 Windows 11 上运行，被认为几乎与 12B 模型一样快，其效率令用户感到惊讶。 AI

影响展示了小型模型在消费级硬件上的高效性能，可能降低了人工智能实验的门槛。

排序理由用户关于模型在消费级硬件上性能的报告。

在 Mastodon — fosstodon.org 阅读 →

基础设施

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Gemma 4:26b-a4b-it-qat 模型在消费级 GPU 上实现每秒 15 个 token 的性能

报道来源 [1]

Mastodon — fosstodon.org TIER_1 English(EN) · [email protected] · 2026-06-21 18:32

Holy crap y'all, gemma4:26b-a4b-it-qat runs at 15 tokens per second on this Nvidia 4070, 8 GB VRAM, 16 GB RAM, Windows 11, almost as fast as the 12B model! What

Holy crap y'all, gemma4:26b-a4b-it-qat runs at 15 tokens per second on this Nvidia 4070, 8 GB VRAM, 16 GB RAM, Windows 11, almost as fast as the 12B model! What sourcery is this? # ai # ollama

报道来源 [1]

Holy crap y'all, gemma4:26b-a4b-it-qat runs at 15 tokens per second on this Nvidia 4070, 8 GB VRAM, 16 GB RAM, Windows 11, almost as fast as the 12B model! What

相关实体

相关话题