研究人员推出了一种新颖的多样本模型合并技术METIS,旨在提高多任务大型语言模型的性能。与仅在训练后合并一次的现有事后合并方法不同,METIS采用迭代协议来减轻任务干扰和信息擦除。该方法利用任务损失差距加权和基于共识的掩码来实现稳定的合并并提高性能,尤其是在表现最差的任务上。 AI
影响 通过解决模型合并过程中的信息擦除问题,引入了一种改进多任务LLM性能的新技术。
排序理由 详细介绍模型合并新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →