English(EN) MADS: Model-Aware Diverse Core Set Selection for Instruction Tuning

新方法通过模型感知数据选择改进LLM指令微调

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-01 04:00

研究人员开发了一种名为模型感知多样性核心集选择（MADS）的新方法，以改进大型语言模型的指令微调。MADS在LLM推理过程中根据神经激活状态区分数据特征，确保所选核心数据集具有更大的多样性。实验表明，由一个3B参数模型选择的核心集可以有效地微调更大的模型，与使用完整数据集相比，平均性能提升高达2.5%。 AI

影响增强模型性能并减少LLM微调的数据需求。

排序理由关于LLM指令微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Yi Bai, Wenhao Zhang, Yao Chen, Jiao Xue, Zhumin Chen, Pengjie Ren · 2026-06-01 04:00

MADS：面向指令调优的模型感知多样性核心集选择

arXiv:2605.30857v1 Announce Type: new Abstract: Instruction fine-tuning is employed to enhance the instruction-following ability of large language models (LLMs). As the amount of instruction fine-tuning data increases, selecting the optimal core set becomes particularly important…

报道来源 [1]

MADS：面向指令调优的模型感知多样性核心集选择

相关实体

相关话题