English(EN) Unifying and Optimizing Data Values for Selection via Sequential Decision-Making

新框架通过序列决策统一数据选择

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-01 04:00

研究人员开发了一个新框架，将数据选择视为一个序列决策问题，利用动态规划来寻找最优选择序列。该方法统一了现有的 Data Shapley 等方法，揭示它们是序列问题的近似，并分析了选择最优性如何随着效用曲率的退化而降低。提出的基于二分图的代理模型提供了可扩展的贪婪选择，并具有可证明的保证，在经典机器学习基准和大规模 LLM 微调数据的实验中显示出显著的改进。 AI

影响为优化机器学习和 LLM 微调中的数据选择提供了理论基础。

排序理由学术论文，详细介绍了新的理论框架和实验结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Hongliang Chi, Qiong Wu, Zhengyi Zhou, Jonathan Light, Emily Dodwell, Yao Ma · 2026-06-01 04:00

通过顺序决策统一和优化选择的数据值

arXiv:2502.04554v2 Announce Type: replace Abstract: Data selection has emerged as a crucial downstream application of data valuation, yet the theoretical foundations for using data values in selection remain underexplored. We reformulate data selection as a sequential decision-ma…

报道来源 [1]

通过顺序决策统一和优化选择的数据值

相关话题