English(EN) Benchmarking on Tasks That Matter: Dataset Selection for Preserving Model Rankings

新框架通过更小的数据集优化机器学习模型基准测试

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-26 11:50

研究人员开发了一个新框架，以应对为机器学习模型基准测试选择代表性数据集的挑战。该框架旨在通过识别更小、更有效的数据子集来降低评估成本，这些子集能够保持大型基准测试中发现的全局模型排名。该研究介绍了各种选择策略，包括引导聚合和贪婪最远优先方法，并评估了它们在时间序列分类和自然语言处理等不同领域的有效性。 AI

影响这项研究通过减少对广泛数据集的需求，可能带来更高效、更具成本效益的机器学习模型评估。

排序理由该集群包含一篇研究论文，详细介绍了用于机器学习基准测试的数据集选择新框架。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv stat.ML TIER_1 English(EN) · Rostislav Gusev, Alexey Zaytsev · 2026-06-29 04:00

Benchmarking on Tasks That Matter: Dataset Selection for Preserving Model Rankings

arXiv:2606.27997v1 Announce Type: cross Abstract: Benchmarks of machine learning models often include many datasets, making evaluation expensive. For efficiency, it is preferable to perform evaluations on small, representative datasets instead. The selection of such subsets typic…
arXiv stat.ML TIER_1 English(EN) · Alexey Zaytsev · 2026-06-26 11:50

在重要任务上进行基准测试：用于保持模型排名的基准数据集选择

Benchmarks of machine learning models often include many datasets, making evaluation expensive. For efficiency, it is preferable to perform evaluations on small, representative datasets instead. The selection of such subsets typically relies on heuristics and is rarely analyzed f…

报道来源 [2]

Benchmarking on Tasks That Matter: Dataset Selection for Preserving Model Rankings

在重要任务上进行基准测试：用于保持模型排名的基准数据集选择

相关实体

相关话题