新的GAIA框架通过全局数据选择增强LLM指令调优

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了GAIA（Global Adaptive Instruction tuning via Gaussian processes），一个用于为大型语言模型（LLM）指令调优选择高质量数据的新框架。与受限于局部批次优化的现有方法不同，GAIA使用高斯过程回归来模拟整个语义空间中的效用。这种全局估计过程，结合自适应策略融合机制，动态地优先处理有价值的样本。该框架还包含动态遗憾保证，即使在训练过程中数据质量分数发生变化，也能确保鲁棒性。 AI

影响这项研究通过提高指令调优阶段使用的数据质量，有望实现更高效、更有效的LLM训练。

排序理由该集群包含一篇详细介绍LLM指令调优新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jun Wang, Quoc Phong Nguyen, Julien Monteil, Vu Nguyen · 2026-06-30 04:00

Online Data Selection for Instruction Tuning via Gaussian Processes

arXiv:2606.30077v1 Announce Type: cross Abstract: With Large Language Model (LLM) pre-training and fine-tuning shifting its focus from data volume to data quality, quality data selection has emerged as a critical research topic. Existing online data selection methods for LLM trai…

报道来源 [1]

Online Data Selection for Instruction Tuning via Gaussian Processes

相关实体

相关话题