QLoRA,即量化低秩适配,是一种能够以显著减少的内存量对大型语言模型进行微调的技术。该方法涉及将模型权重量化为4位精度,从而将其大小有效减小四分之三,同时为适配参数保持16位精度。这种方法使得在单个GPU上微调多达650亿参数的模型成为可能。 AI
影响 使在消费级硬件上微调大型语言模型成为可能,从而普及了对高级AI定制的访问。
排序理由 该条目解释了一种用于微调大型语言模型的特定研究技术(QLoRA)。[lever_c_demoted from research: ic=1 ai=1.0]
在 Medium — fine-tuning tag 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →