PulseAugur
实时 13:13:36
English(EN) BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining

新的BLISS方法通过高效的数据选择加速LLM预训练

研究人员开发了BLISS,一种用于更高效地预训练大型语言模型的数据选择新方法。与以前的方法不同,BLISS不需要外部预训练模型,并且通过使用代理模型和评分模型来考虑数据的长期影响。这种双层优化方法允许BLISS预测训练样本的影响得分,从而实现高质量数据的选择。使用Pythia和LLaMA模型进行的实验表明,与最先进的方法相比,BLISS在达到目标性能方面实现了1.7倍的加速。 AI

影响 通过优化数据选择,实现更快、更高效的大型语言模型预训练。

排序理由 该集群包含一篇详细介绍语言模型预训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Jie Hao, Rui Yu, Wei Zhang, Huixia Wang, Jie Xu, Mingrui Liu ·

    BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining

    arXiv:2510.06048v4 Announce Type: replace Abstract: Effective data selection is essential for pretraining large language models (LLMs), enhancing efficiency and improving generalization to downstream tasks. However, existing approaches often require leveraging external pretrained…