实体
Brier score
Brier score
PulseAugur coverage of Brier score — every cluster mentioning Brier score across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
AI oversight faces calibration impossibility, researchers find
Researchers have identified a fundamental challenge in ensuring AI agents provide truthful reports when their own incentives are tied to the report's outcome. They demonstrate that optimal oversight mechanisms, designed…
-
Manokhin 概率矩阵为分类器质量提供新框架
研究人员引入了 Manokhin 概率矩阵,这是一个旨在评估分类器概率预测质量的新诊断框架。该框架区分了可靠性和分辨率,将分类器分为四种原型:Eagle、Bull、Sloth 和 Mole。一项对 21 个分类器和 30 个任务进行的实证研究发现,像 CatBoost 和 Random Forest 这样的模型是 Eagles,而 XGBoost 和 LightGBM 是 Bulls,这对事后校准具有特定意义。