研究人员开发了BLISS,一种用于更高效地预训练大型语言模型的数据选择新方法。与以前的方法不同,BLISS不需要外部预训练模型,并且通过使用代理模型和评分模型来考虑数据的长期影响。这种双层优化方法允许BLISS预测训练样本的影响得分,从而实现高质量数据的选择。使用Pythia和LLaMA模型进行的实验表明,与最先进的方法相比,BLISS在达到目标性能方面实现了1.7倍的加速。 AI
影响 通过优化数据选择,实现更快、更高效的大型语言模型预训练。
排序理由 该集群包含一篇详细介绍语言模型预训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →