English(EN) From Instance Selection to Fixed-Pool Data Recipe Search for Supervised Fine-Tuning

新方法搜索数据配方以优化 AI 模型微调

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-13 03:27

研究人员开发了一种新的监督微调 (SFT) 数据选择方法，超越了简单的实例排序，采用了“数据配方搜索”方法。该技术使用过滤和去重等算子库，在有限的完整 SFT 评估预算内构建高质量的训练子集。他们的系统 AutoSelection 将数据物化与昂贵的评估分离开来，在多个基础模型上取得了比现有方法更优越的推理性能。 AI

影响引入了一种更有效的数据集策展方法，有可能以更少的资源提高模型性能。

排序理由该集群包含一篇详细介绍 AI 模型微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

Supervised Fine-Tuning

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Yongqi Zhang · 2026-05-13 03:27

从实例选择到监督微调的固定池数据配方搜索

Supervised fine-tuning (SFT) data selection is commonly formulated as instance ranking: score each example and retain a top-$k$ subset. However, effective SFT training subsets are often produced through ordered curation recipes, where filtering, mixing, and deduplication operator…

报道来源 [1]

从实例选择到监督微调的固定池数据配方搜索

相关实体

相关话题