一项新研究显示,大型语言模型在招聘决策中表现出亲女性性别偏见,即使是在使用日式履历(rirekisho)格式简历的日本企业环境中。研究人员测试了五种最先进的LLM,包括Claude Sonnet 4.6、GPT-4o、DeepSeek-V3、Gemini 2.5-Flash和Llama 3.3-70B,进行了43,200次API调用。虽然提示层面的性别中立指令并未显著减少偏见,但从提示中移除候选人姓名几乎消除了亲女性效应,表明姓名是主要的性别传递渠道。研究还指出,GPT-4o的内容安全过滤器在尝试姓名匿名化时导致了很高的拒绝率,这是一个实际部署的挑战。 AI
影响 强调在招聘中谨慎部署LLM的必要性,以避免加剧性别偏见,尤其是在候选人身份识别方面。
排序理由 该集群包含一篇详细介绍LLM偏见研究结果的学术论文。
- arXiv
- Claude Sonnet 4.6
- DeepSeek-V3
- Gemini 2.5-Flash
- GPT-4o
- Hugging Face
- Japan
- Llama 3.3-70B
- rirekisho
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →