English(EN) RISED: A Pre-Deployment Evaluation Framework for High-Stakes AI Decision-Support Systems, with Application to Healthcare

新框架RISED超越准确性评估AI决策支持系统

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了RISED，一个用于在部署前评估人工智能决策支持系统的新框架，特别是在医疗保健等高风险领域。与依赖单一准确性指标的传统方法不同，RISED评估五个关键维度：可靠性（Reliability）、包容性（Inclusivity）、敏感性（Sensitivity）、公平性（Equity）和可部署性（Deployability）。当应用于涵盖医疗、信贷和收入预测的各种数据集时，RISED揭示了包容性和敏感性方面存在的重大缺陷，而这些缺陷此前被总体准确性分数所掩盖，表明这些问题是数据驱动的，而非模型特有的。 AI

影响该框架可以提高部署在医疗保健等关键领域的人工智能系统的安全性和可靠性。

排序理由该集群包含一篇详细介绍人工智能系统新评估框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Rohith Reddy Bellibatlu, Manpreet Singh, Yash Jajoo, Shyamal Lakhanpal, Abhishek Israni · 2026-06-02 04:00

RISED: A Pre-Deployment Evaluation Framework for High-Stakes AI Decision-Support Systems, with Application to Healthcare

arXiv:2605.12895v2 Announce Type: replace-cross Abstract: Clinical decision-support systems are expert systems whose recommendations clinicians act on directly, yet they are usually cleared on one aggregate accuracy number from a held-out test set. That number says nothing about …

报道来源 [1]

RISED: A Pre-Deployment Evaluation Framework for High-Stakes AI Decision-Support Systems, with Application to Healthcare

相关实体

相关话题