PulseAugur
实时 13:54:18

New Quantized Evolution Strategies Enable Fine-Tuning of LLMs

研究人员推出了一种名为量化进化策略(QES)的新型优化范式,旨在直接在其离散参数空间内对量化大语言模型(LLMs)进行微调。该方法解决了传统微调技术依赖连续权重和反向传播的局限性,使其不适用于量化模型。QES 结合了累积误差反馈以实现精确的权重更新,并使用无状态种子重放来最小化内存使用,从而能够以低精度推理成本进行微调。与现有的零阶微调方法相比,该方法表现出更优越的性能,为完全在量化域内扩展 LLMs 铺平了道路。 AI

影响 能够在外存受限设备上更高效地部署和微调大语言模型。

排序理由 这是一篇详细介绍量化 LLMs 微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Yinggan Xu, Kajetan Schweighofer, Risto Miikkulainen, Xin Qiu ·

    Quantized Evolution Strategies: High-precision Fine-tuning of Quantized LLMs at Low-precision Cost

    arXiv:2602.03120v2 Announce Type: replace-cross Abstract: Post-Training Quantization (PTQ) is essential for deploying Large Language Models (LLMs) on memory-constrained devices, yet it renders models static and difficult to fine-tune. Standard fine-tuning paradigms, including Rei…