PulseAugur
实时 03:40:02
实体 Brier score

Brier score

PulseAugur coverage of Brier score — every cluster mentioning Brier score across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_25570 ·

    AI oversight faces calibration impossibility, researchers find

    Researchers have identified a fundamental challenge in ensuring AI agents provide truthful reports when their own incentives are tied to the report's outcome. They demonstrate that optimal oversight mechanisms, designed…

  2. RESEARCH · CL_18337 ·

    Manokhin 概率矩阵为分类器质量提供新框架

    研究人员引入了 Manokhin 概率矩阵,这是一个旨在评估分类器概率预测质量的新诊断框架。该框架区分了可靠性和分辨率,将分类器分为四种原型:Eagle、Bull、Sloth 和 Mole。一项对 21 个分类器和 30 个任务进行的实证研究发现,像 CatBoost 和 Random Forest 这样的模型是 Eagles,而 XGBoost 和 LightGBM 是 Bulls,这对事后校准具有特定意义。