English(EN) Training ML Models with Predictable Failures

新的可预测性损失提高了机器学习模型故障预测的准确性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-14 17:41

研究人员开发了一种新的微调目标，称为可预测性损失，以提高部署规模下机器学习模型故障率预测的准确性。该方法解决了现有估计器中可能导致故障过度预测的偏差。通过在语言模型和强化学习代理的初步概念实验中减少预留的预测误差，可预测性损失旨在在不影响主要任务性能的情况下增强部署前的安全评估。 AI

影响通过提高部署规模故障率的预测能力，增强了机器学习模型的安全性，有助于进行更稳健的部署前评估。

排序理由该集群包含一篇详细介绍机器学习模型安全评估新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Scott Niekum · 2026-05-14 17:41

使用可预测的故障训练机器学习模型

Estimating how often an ML model will fail at deployment scale is central to pre-deployment safety assessment, but a feasible evaluation set is rarely large enough to observe the failures that matter. Jones et al. (2025) address this by extrapolating from the largest k failure sc…