PulseAugur
实时 00:08:16
English(EN) I mapped which local LLMs actually fit each RAM tier, 8 to 128GB (open dataset)

数据集映射本地大语言模型至内存级别,辅助硬件选择

一个全面的数据集已在GitHub上汇编并发布,详细说明了哪些本地大语言模型(LLMs)可以在8GB至128GB的各种内存级别上运行。该数据集提供了一个经验法则,即Q4_K_M量化模型每十亿参数大约需要0.6GB内存,用户应目标使用约70%的可用内存或显存来容纳操作系统、上下文和KV缓存。该资源包括具体的模型细节、量化级别、加载大小和运行它们的命令行说明,重点关注Apple Silicon和消费级NVIDIA硬件。 AI

影响 为用户在消费级硬件上选择和运行大语言模型提供了关键数据,降低了本地AI模型部署的门槛。

排序理由 发布了详细说明本地大语言模型硬件要求的 数据集。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

数据集映射本地大语言模型至内存级别,辅助硬件选择

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/WecK0 ·

    我绘制了本地 LLM 实际适合各 RAM 级别(8GB 至 128GB)的图表(开放数据集)

    <!-- SC_OFF --><div class="md"><p>I kept answering the same question for friends (&quot;I've got a 16GB MacBook / a 3060, what can I actually run?&quot;) and got tired of guessing, so I started a spreadsheet. It grew into a real dataset, so I put it on GitHub under CC BY for anyo…