研究人员推出RAFT,一个新颖的两阶段框架,旨在改进语言模型的领域特定微调,同时减轻在通用任务上的性能下降。RAFT通过自条件重写和语义过滤首先精炼领域特定数据,从而解决监督兼容性和轨迹保持等问题。然后,它采用一种自适应蒸馏过程,以原始模型在生成轨迹上的行为作为软目标,并以精炼后的答案为条件。 AI
影响 这项研究提供了一种在不牺牲通用能力的情况下改进领域特定AI模型的方法,有望带来更强大、更多功能的AI应用。
排序理由 这是一篇详细介绍语言模型微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →