研究人员推出OCRR,这是一个新的基准,旨在评估机器学习系统通过在线纠正从分布变化中恢复的程度。与静态基准不同,OCRR模拟了模型遇到新数据类别并必须适应的现实世界场景。该基准衡量了在应用纠正时,新类别上的准确性以及原始数据上准确性的保留情况。 AI
影响 为自适应机器学习系统引入了一种新的评估方法,可能提高实际部署的鲁棒性。
排序理由 该集群描述了一篇新发表在arXiv上的学术基准论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →
研究人员推出OCRR,这是一个新的基准,旨在评估机器学习系统通过在线纠正从分布变化中恢复的程度。与静态基准不同,OCRR模拟了模型遇到新数据类别并必须适应的现实世界场景。该基准衡量了在应用纠正时,新类别上的准确性以及原始数据上准确性的保留情况。 AI
影响 为自适应机器学习系统引入了一种新的评估方法,可能提高实际部署的鲁棒性。
排序理由 该集群描述了一篇新发表在arXiv上的学术基准论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →
arXiv:2605.03153v1 Announce Type: new Abstract: Static benchmarks measure a model frozen at training time. Real systems face distribution shift: new categories, paraphrased queries, drift: and must recover online via user corrections. No existing benchmark measures recovery speed…
Static benchmarks measure a model frozen at training time. Real systems face distribution shift: new categories, paraphrased queries, drift: and must recover online via user corrections. No existing benchmark measures recovery speed under correction streams. We introduce OCRR (On…