两篇新研究论文强调了领先的大型语言模型中存在显著的性别、种族和年龄偏见。第一篇论文评估了 Gemini 1.5 Pro、Llama 3 70B、Claude 3 Opus 和 GPT-4o,发现去偏见努力可能适得其反地加剧了差异。第二篇论文审计了 Claude、GPT、Gemini、DeepSeek、Syn-Pro 和 HyperCLOVA X 等模型在多种语言中的表现,揭示了 LLM 表现出的刻板印象范围远远超出人类基线,并且翻译可能会掩盖偏见的复杂重排。 AI
影响 这些研究强调了 LLM 中关键的公平性问题,表明当前的去偏见方法不足,并且复杂的跨语言偏见需要更细致的解决方案。
排序理由 arXiv 上发表了两篇学术论文,提出了关于 LLM 偏见的发现。
- Claude
- Claude 3 Opus
- DeepSeek
- Gemini
- Gemini 1.5 Pro
- GPT
- GPT-4o
- HyperCLOVA X
- Llama 3 70B
- Vishal Mirza
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →