研究人员开发了一个新框架,将数据选择视为一个序列决策问题,利用动态规划来寻找最优选择序列。该方法统一了现有的 Data Shapley 等方法,揭示它们是序列问题的近似,并分析了选择最优性如何随着效用曲率的退化而降低。提出的基于二分图的代理模型提供了可扩展的贪婪选择,并具有可证明的保证,在经典机器学习基准和大规模 LLM 微调数据的实验中显示出显著的改进。 AI
影响 为优化机器学习和 LLM 微调中的数据选择提供了理论基础。
排序理由 学术论文,详细介绍了新的理论框架和实验结果。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →