PulseAugur
实时 11:29:12
实体 Ece

Ece

PulseAugur coverage of Ece — every cluster mentioning Ece across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_16068 ·

    提出新指标以更好地评估AI模型校准和风险

    研究人员引入了新的指标来评估机器学习模型的校准,超越了传统的期望校准误差(ECE)。提出的校准尺寸比(CSR)指标旨在提供对过度自信风险更鲁棒的评估,而ECE可能会掩盖重大风险。此外,该论文还引入了置信度加权指标,如置信度加权准确率(cwA)和置信度加权AUC(cwAUC),以衡量分配的置信度在区分正确和不正确的预测方面的有效性。

  2. TOOL · CL_24191 ·

    New metrics challenge AI confidence calibration standards

    Researchers have introduced new metrics to evaluate the calibration of AI model confidence scores, moving beyond the traditional Expected Calibration Error (ECE). The proposed Calibrated Size Ratio (CSR) and confidence-…