发表在arXiv上的一项新研究揭示,大型语言模型在医疗分诊建议中表现出基于性别的偏见。当呈现相同的神经系统症状时,Gemini 3.5 Flash、Claude Sonnet 4.6 和 GPT-5.4-mini 等模型对年轻女性的紧急程度评分低于年龄匹配的男性。这种差异源于诊断替代,模型倾向于选择与性别相关的疾病,导致女性患者尽管症状严重程度相当,但获得的护理建议却不那么紧急。 AI
影响 揭示了AI医疗工具中的关键偏见,需要谨慎设计以避免加剧健康不平等。
排序理由 该集群包含一篇详细介绍大型语言模型偏见研究结果的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →