研究人员推出了一种名为量化进化策略(QES)的新型优化范式,旨在直接在其离散参数空间内对量化大语言模型(LLMs)进行微调。该方法解决了传统微调技术依赖连续权重和反向传播的局限性,使其不适用于量化模型。QES 结合了累积误差反馈以实现精确的权重更新,并使用无状态种子重放来最小化内存使用,从而能够以低精度推理成本进行微调。与现有的零阶微调方法相比,该方法表现出更优越的性能,为完全在量化域内扩展 LLMs 铺平了道路。 AI
影响 能够在外存受限设备上更高效地部署和微调大语言模型。
排序理由 这是一篇详细介绍量化 LLMs 微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Evolution Strategies
- Hugging Face
- large-language models
- Quantized Evolution Strategies
- reinforcement learning
- Xin Qiu
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →