研究人员引入了衡量多类别预测中校准误差的新方法,重点关注“真实性”概念。这意味着该测量能够准确反映预测器在报告其真实条件标签分布时的性能。该研究将真实校准误差推广到标签分布的多维属性,包括完全多类别和逐类校准,并为置信度校准提供了真实性修正。经验上,与传统的非真实性方法相比,这些真实性误差在不同分箱选择下表现出更稳定的模型排名。 AI
影响 引入了一种更鲁棒的概率预测器评估方法,有望在机器学习应用中实现更好的模型选择和调优。
排序理由 学术论文,介绍了用于评估机器学习模型的新方法论。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →