PulseAugur
实时 07:44:42
English(EN) From Instance Selection to Fixed-Pool Data Recipe Search for Supervised Fine-Tuning

新方法搜索数据配方以优化 AI 模型微调

研究人员开发了一种新的监督微调 (SFT) 数据选择方法,超越了简单的实例排序,采用了“数据配方搜索”方法。该技术使用过滤和去重等算子库,在有限的完整 SFT 评估预算内构建高质量的训练子集。他们的系统 AutoSelection 将数据物化与昂贵的评估分离开来,在多个基础模型上取得了比现有方法更优越的推理性能。 AI

影响 引入了一种更有效的数据集策展方法,有可能以更少的资源提高模型性能。

排序理由 该集群包含一篇详细介绍 AI 模型微调新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新方法搜索数据配方以优化 AI 模型微调

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Yongqi Zhang ·

    从实例选择到监督微调的固定池数据配方搜索

    Supervised fine-tuning (SFT) data selection is commonly formulated as instance ranking: score each example and retain a top-$k$ subset. However, effective SFT training subsets are often produced through ordered curation recipes, where filtering, mixing, and deduplication operator…