PulseAugur
实时 07:04:17
实体 UCSD Ped2

UCSD Ped2

PulseAugur coverage of UCSD Ped2 — every cluster mentioning UCSD Ped2 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_118065 ·

    研究发现AI监控基准在现实世界测试中失败

    一项对AI监控系统的新审计显示,基准性能指标(特别是AUC分数)无法转化为实际部署能力。研究人员发现,在某个数据集和场景上训练的模型,当应用于不同数据集和场景时,其表现不比随机猜测好,AUC分数从平均0.704显著下降到0.499。这表明当前的基准高估了AI在监控中异常检测的可靠性,而表现最强的模型反而加剧了这个问题。