一个全面的数据集已在GitHub上汇编并发布,详细说明了哪些本地大语言模型(LLMs)可以在8GB至128GB的各种内存级别上运行。该数据集提供了一个经验法则,即Q4_K_M量化模型每十亿参数大约需要0.6GB内存,用户应目标使用约70%的可用内存或显存来容纳操作系统、上下文和KV缓存。该资源包括具体的模型细节、量化级别、加载大小和运行它们的命令行说明,重点关注Apple Silicon和消费级NVIDIA硬件。 AI
影响 为用户在消费级硬件上选择和运行大语言模型提供了关键数据,降低了本地AI模型部署的门槛。
排序理由 发布了详细说明本地大语言模型硬件要求的 数据集。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →