ScoringBench: A Benchmark for Evaluating Tabular Foundation Models with Proper Scoring Rules

作者 PulseAugur 编辑部 · [3 个来源] · 2026-04-28 02:56

两篇新研究论文介绍了用于更好地评估和清理表格基础模型的方法。ScoringBench 提供了一个使用恰当评分规则的综合基准，用于评估超越简单点估计的模型性能，揭示了不同指标如何导致模型排名各异。另一方面，Prior-Aligned Data Cleaning 提出了一个深度强化学习框架来清理真实世界的表格数据，解决了诸如缺失值和异常值等问题，以提高模型准确性和置信度校准。 AI

影响新的评估和数据清理技术可以提高表格基础模型在高风险应用中的可靠性和部署。

排序理由该集群包含两篇学术论文，介绍了表格基础模型的新基准和方法论。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。我们如何撰写摘要 →

ScoringBench: A Benchmark for Evaluating Tabular Foundation Models with Proper Scoring Rules

报道来源 [3]

arXiv cs.LG TIER_1 English(EN) · Laure Berti-Equille · 2026-04-29 04:00

面向表格基础模型的先验对齐数据清洗

arXiv:2604.25154v1 Announce Type: new Abstract: Tabular Foundation Models (TFMs) achieve state-of-the-art zero-shot accuracy on small tabular datasets by meta-learning over synthetic data-generating processes -- making them highly attractive for practitioners who cannot afford la…
arXiv cs.AI TIER_1 English(EN) · Jonas Landsgesell, Pascal Knoll, Tizian Wenzel · 2026-04-28 04:00

ScoringBench：一个使用恰当评分规则评估表格基础模型的基准

arXiv:2603.29928v2 Announce Type: replace Abstract: Tabular foundation models such as TabPFN and TabICL already produce full predictive distributions, yet prevailing regression benchmarks evaluate them almost exclusively via point-estimate metrics (RMSE, $R^2$). This discards pre…
arXiv cs.LG TIER_1 English(EN) · Laure Berti-Equille · 2026-04-28 02:56

面向表格基础模型的先验对齐数据清洗

Tabular Foundation Models (TFMs) achieve state-of-the-art zero-shot accuracy on small tabular datasets by meta-learning over synthetic data-generating processes -- making them highly attractive for practitioners who cannot afford large annotated corpora. However, their in-context…

报道来源 [3]

面向表格基础模型的先验对齐数据清洗

ScoringBench：一个使用恰当评分规则评估表格基础模型的基准

面向表格基础模型的先验对齐数据清洗

相关实体

相关话题