PulseAugur
实时 19:39:28
English(EN) ORBIT: Preserving Foundational Language Capabilities in GenRetrieval via Origin-Regulated Merging

新的ORBIT方法可防止LLM在微调过程中发生灾难性遗忘

研究人员推出了一种名为ORBIT的新方法,旨在防止大型语言模型在特定任务微调过程中丢失其基础语言能力。这种被称为灾难性遗忘的问题在生成检索任务中尤为普遍,并且与模型参数的分歧有关。ORBIT通过监控微调模型和原始模型权重之间的距离来解决这个问题,当超过设定的阈值时,采用权重平均策略来限制参数漂移。实验表明,ORBIT能有效保留文本和检索性能,优于现有的持续学习和正则化技术。 AI

影响 在特定任务的LLM微调过程中保留通用语言能力,可能提高模型的通用性。

排序理由 发表了一篇介绍LLM微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的ORBIT方法可防止LLM在微调过程中发生灾难性遗忘

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Xinyang Yi ·

    ORBIT: Preserving Foundational Language Capabilities in GenRetrieval via Origin-Regulated Merging

    Despite the rapid advancements in large language model (LLM) development, fine-tuning them for specific tasks often results in the catastrophic forgetting of their general, language-based reasoning abilities. This work investigates and addresses this challenge in the context of t…