PulseAugur
实时 17:45:55
English(EN) Early Data Exposure Improves Robustness to Subsequent Fine-Tuning

早期数据暴露可提高大型语言模型对微调的鲁棒性

研究人员发现,在训练过程早期就将数据暴露给语言模型,特别是将训练后数据混入预训练阶段,可以显著提高模型在后续微调后保留目标能力的能力。这种“早期暴露”方法在拥有 1.35 亿和 10 亿参数模型的实验中,即使在计算资源匹配的情况下,也始终优于其他训练方法。研究表明,在预训练阶段就建立对未来微调的鲁棒性,应成为主要目标,而不是仅仅依赖于在微调阶段缓解遗忘的方法。 AI

影响 提出了一种训练更鲁棒的大型语言模型的新方法,该模型在微调后能更好地保留能力。

排序理由 学术论文,详细介绍了大型语言模型的一种新颖训练方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

早期数据暴露可提高大型语言模型对微调的鲁棒性

报道来源 [1]

  1. Hugging Face Daily Papers TIER_1 English(EN) ·

    Early Data Exposure Improves Robustness to Subsequent Fine-Tuning

    How can we train models whose post-trained capabilities survive subsequent fine-tuning? Rather than focusing on downstream interventions to mitigate forgetting of upstream capabilities, we study how upstream training choices - that is, the manner in which a capability is acquired…