PulseAugur
实时 12:50:16

单个LLM层主导零阶微调

研究人员发现,在使用零阶(ZO)优化时,微调大型语言模型(LLM)的单个层与微调整个模型一样有效。通过在训练前分析激活值异常值来识别出的这个主导层,在各种任务和模型系列中,其效果始终能媲美甚至超越全模型ZO微调。主导层的有效性源于其高扰动敏感性和在残差流中的早期位置,这使得优化信号能够高效传播。该方法显著加快了速度,实验显示训练速度提高了4.52倍,同时保持或提高了性能。 AI

影响 这项研究可能显著降低微调LLM所需的计算成本和时间,使先进的模型适应更加普及。

排序理由 该集群包含一篇详细介绍LLM微调新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Wanhao Yu, Ziyan Wang, Zheng Wang, Abeer Matar Almalky, Yihang Zuo, Shuteng Niu, Sen Lin, Adnan Siraj Rakin, Deliang Fan, Li Yang ·

    Dominant-Layer ZO:LLM零阶微调的单一主导层

    arXiv:2606.05516v1 Announce Type: new Abstract: Zeroth-order (ZO) optimization enables memory-efficient fine-tuning of large language models (LLMs) using only forward passes, but it remains unclear how useful adaptation is distributed across layers. In this work, we reveal a surp…