English(EN) Early Data Exposure Improves Robustness to Subsequent Fine-Tuning

早期数据暴露可提高大型语言模型对微调的鲁棒性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-12 20:08

研究人员发现，在训练过程早期就将数据暴露给语言模型，特别是将训练后数据混入预训练阶段，可以显著提高模型在后续微调后保留目标能力的能力。这种“早期暴露”方法在拥有 1.35 亿和 10 亿参数模型的实验中，即使在计算资源匹配的情况下，也始终优于其他训练方法。研究表明，在预训练阶段就建立对未来微调的鲁棒性，应成为主要目标，而不是仅仅依赖于在微调阶段缓解遗忘的方法。 AI

影响提出了一种训练更鲁棒的大型语言模型的新方法，该模型在微调后能更好地保留能力。

排序理由学术论文，详细介绍了大型语言模型的一种新颖训练方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-12 20:08

Early Data Exposure Improves Robustness to Subsequent Fine-Tuning

How can we train models whose post-trained capabilities survive subsequent fine-tuning? Rather than focusing on downstream interventions to mitigate forgetting of upstream capabilities, we study how upstream training choices - that is, the manner in which a capability is acquired…

报道来源 [1]

Early Data Exposure Improves Robustness to Subsequent Fine-Tuning

相关实体

相关话题