English(EN) How Much Does It Actually Cost to Run a Local LLM? (€ per Million Tokens, Measured)

本地 LLM 成本揭晓：小型模型比云端便宜，大型模型更贵

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-22 18:33

在一台配备 RTX 3090 GPU 的单机上进行的受控基准测试，测量了运行本地大型语言模型（LLM）的实际成本，以每百万 token 欧元计。结果显示，像 Gemma 3:1B 这样的小型模型比托管 API 便宜得多，每百万 token 成本约为 0.118 欧元。然而，像 Gemma 3:27B 这样的大型模型由于能耗高和吞吐量低，本地运行成本更高，每百万 token 成本为 0.706 欧元，这还不包括硬件折旧。 AI

影响强调了本地运行 LLM 的成本效益高度依赖于模型大小和硬件效率，挑战了本地部署总是更便宜的假设。

排序理由该项目详细说明了 LLM 运营成本的具体、可复现的基准测试和分析，类似于研究发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Arsen Apostolov · 2026-06-22 18:33

How Much Does It Actually Cost to Run a Local LLM? (€ per Million Tokens, Measured)

<p>"It runs on my own GPU, so it's basically free." I believed that until I put a meter on it. So I ran a controlled benchmark on one box — an openSUSE machine with a single RTX 3090 — driving three local models through ollama under an identical fixed workload (256-token generati…

报道来源 [1]

How Much Does It Actually Cost to Run a Local LLM? (€ per Million Tokens, Measured)

相关实体

相关话题