研究人员推出了一种名为ORBIT的新方法,旨在防止大型语言模型在特定任务微调过程中丢失其基础语言能力。这种被称为灾难性遗忘的问题在生成检索任务中尤为普遍,并且与模型参数的分歧有关。ORBIT通过监控微调模型和原始模型权重之间的距离来解决这个问题,当超过设定的阈值时,采用权重平均策略来限制参数漂移。实验表明,ORBIT能有效保留文本和检索性能,优于现有的持续学习和正则化技术。 AI
影响 在特定任务的LLM微调过程中保留通用语言能力,可能提高模型的通用性。
排序理由 发表了一篇介绍LLM微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →