English(EN) BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining

新的BLISS方法通过高效的数据选择加速LLM预训练

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了BLISS，一种用于更高效地预训练大型语言模型的数据选择新方法。与以前的方法不同，BLISS不需要外部预训练模型，并且通过使用代理模型和评分模型来考虑数据的长期影响。这种双层优化方法允许BLISS预测训练样本的影响得分，从而实现高质量数据的选择。使用Pythia和LLaMA模型进行的实验表明，与最先进的方法相比，BLISS在达到目标性能方面实现了1.7倍的加速。 AI

影响通过优化数据选择，实现更快、更高效的大型语言模型预训练。

排序理由该集群包含一篇详细介绍语言模型预训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Jie Hao, Rui Yu, Wei Zhang, Huixia Wang, Jie Xu, Mingrui Liu · 2026-06-02 04:00

BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining

arXiv:2510.06048v4 Announce Type: replace Abstract: Effective data selection is essential for pretraining large language models (LLMs), enhancing efficiency and improving generalization to downstream tasks. However, existing approaches often require leveraging external pretrained…

报道来源 [1]

BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining

相关实体

相关话题