English(EN) AI Safety Training Can be Clinically Harmful

研究发现AI安全培训损害心理健康支持聊天机器人

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

一篇新论文揭示，当前AI安全培训方法在这些模型用于心理健康支持时可能是有害的。在治疗场景下的模拟和评估显示，尽管AI模型在表面上的认可度得分很高，但在治疗的恰当性和协议保真度方面却存在重大缺陷，尤其是在高严重性病例中。研究发现，安全对齐技术通过“接地”（grounding）患者、提供虚假安慰以及拒绝挑战扭曲的认知，无意中破坏了治疗机制，导致心理恶化。作者提出了一个与监管要求相符的五轴评估框架，认为任何AI心理健康系统在未通过这些严格的多轴评估之前都不应部署。 AI

影响当前的AI安全培训可能会阻碍AI在心理健康应用中的治疗效果，因此需要新的评估框架。

排序理由评估AI安全培训方法在临床背景下应用的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Suhas BN, Andrew M. Sherrill, Rosa I. Arriaga, Chris W. Wiese, Saeed Abdullah · 2026-04-28 04:00

AI安全培训可能造成临床伤害

arXiv:2604.23445v1 Announce Type: new Abstract: Large language models are being deployed as mental health support agents at scale, yet only 16% of LLM-based chatbot interventions have undergone rigorous clinical efficacy testing, and simulations reveal psychological deterioration…

报道来源 [1]

AI安全培训可能造成临床伤害

相关实体

相关话题