研究人员开发了TukaBench,一个旨在评估大语言模型(LLMs)在七种非洲语言中安全性的新基准。该基准超越了简单的翻译,整合了文化适应性提示、经过GPT-5.2验证的人工策划提示以及代码转换提示。初步研究结果表明,与英语相比,LLMs拒绝非洲语言提示的可能性较低,而具有文化特异性的提示拒绝率最低。研究还强调了LLMs在这些低资源语言中作为裁判时的理解能力和可靠性挑战。 AI
影响 该基准对于提高LLMs在代表性不足的语言中的安全性和可靠性至关重要,推动更公平的AI发展。
排序理由 该集群包含一篇介绍LLM安全评估新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →