English(EN) Patterns vs. Patients: Evaluating LLMs against Mental Health Professionals on Personality Disorder Diagnosis through First-Person Narratives

大型语言模型在通过文本诊断人格障碍方面优于心理健康专家

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

一项新研究评估了大型语言模型（特别是Gemini Pro）在根据自传体叙述诊断人格障碍方面与心理健康专业人士的对比情况。虽然大型语言模型在整体诊断评分上表现更高，尤其是在边缘性人格障碍方面，但它们在诊断自恋型人格障碍方面存在显著不足。模型提供了详细的、以模式为中心的理由，这与人类专家的更简洁、以患者为中心的方法形成对比，突显了大型语言模型临床评估中潜在的偏见和可靠性问题。 AI

影响大型语言模型在临床叙事分析方面显示出潜力，但由于偏见和可靠性问题，需要仔细验证。

排序理由学术论文，评估大型语言模型在特定临床任务上与人类专家的表现。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Karolina Dro\.zd\.z, Kacper Dudzic, Anna Sterna, Marcin Moskalewicz · 2026-04-28 04:00

模式 vs. 患者：通过第一人称叙述评估大型语言模型与精神科医生在人格障碍诊断上的表现

arXiv:2512.20298v2 Announce Type: replace Abstract: Growing reliance on LLMs for psychiatric self-assessment raises questions about their ability to interpret qualitative patient narratives. This depth-first case study provides the first direct comparison of state-of-the-art LLMs…

报道来源 [1]

模式 vs. 患者：通过第一人称叙述评估大型语言模型与精神科医生在人格障碍诊断上的表现

相关实体

相关话题