研究人员开发了一种新的监督微调 (SFT) 数据选择方法,超越了简单的实例排序,采用了“数据配方搜索”方法。该技术使用过滤和去重等算子库,在有限的完整 SFT 评估预算内构建高质量的训练子集。他们的系统 AutoSelection 将数据物化与昂贵的评估分离开来,在多个基础模型上取得了比现有方法更优越的推理性能。 AI
影响 引入了一种更有效的数据集策展方法,有可能以更少的资源提高模型性能。
排序理由 该集群包含一篇详细介绍 AI 模型微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →