研究人员开发了一种名为正交子空间鲁棒模型合并 (OSRM) 的新方法,以解决使用低秩适应 (LoRA) 微调的模型合并时性能下降的问题。该技术在微调前约束 LoRA 子空间,防止任务特定更新对其他任务产生负面影响。OSRM 集成了现有的合并算法以减少干扰,并在大量实验中证明了其合并性能的提高和单任务准确性的保留。 AI
影响 提高了部署和存储多个微调大语言模型的效率。
排序理由 关于模型合并新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →