PulseAugur
实时 12:55:39

新的FoRA方法可大幅减少微调参数并提高准确性

研究人员推出了一种新颖的参数高效微调方法FoRA,该方法通过选择信息层来优先减少可训练参数的数量。该方法使用对角线Fisher分数进行层选择,并在Stiefel流形上训练LoRA降维投影,在半数参数预算下始终优于LoRA和DoRA等现有方法。与AdaLoRA相比,FoRA在参数数量显著减少的情况下也表现出具有竞争力的准确性,并在各种LLaMA系列、Qwen3和Gemma骨干网络上显示出一致的提升。 AI

影响 这种新的微调方法可以实现更高效的大型语言模型训练,使先进的人工智能更加普及。

排序理由 这是一篇详细介绍参数高效微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的FoRA方法可大幅减少微调参数并提高准确性

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Juneyoung Park, Seongbae Lee, Han-Sang Lee, Kyuho Lee, Minjae Kim, Seungheon Hyeon, Kiduk Kwon, Seongwan Kim, Jaeho Lee ·

    FoRA:用于参数高效微调的 Fisher-正交秩适应

    arXiv:2605.29317v1 Announce Type: new Abstract: Parameter-efficient fine-tuning(PEFT) has largely focused on LoRA and its accuracy-oriented variants, leaving the original goal of reducing trainable parameters has receivedcomparatively little attention. We introduce FoRA, which re…