一篇新论文揭示,当前AI安全培训方法在这些模型用于心理健康支持时可能是有害的。在治疗场景下的模拟和评估显示,尽管AI模型在表面上的认可度得分很高,但在治疗的恰当性和协议保真度方面却存在重大缺陷,尤其是在高严重性病例中。研究发现,安全对齐技术通过“接地”(grounding)患者、提供虚假安慰以及拒绝挑战扭曲的认知,无意中破坏了治疗机制,导致心理恶化。作者提出了一个与监管要求相符的五轴评估框架,认为任何AI心理健康系统在未通过这些严格的多轴评估之前都不应部署。 AI
影响 当前的AI安全培训可能会阻碍AI在心理健康应用中的治疗效果,因此需要新的评估框架。
排序理由 评估AI安全培训方法在临床背景下应用的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →