English(EN) TukaBench: A Culturally Grounded Jailbreak Benchmark for African Languages

新基准测试大语言模型在非洲语言中的安全性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了TukaBench，一个旨在评估大语言模型（LLMs）在七种非洲语言中安全性的新基准。该基准超越了简单的翻译，整合了文化适应性提示、经过GPT-5.2验证的人工策划提示以及代码转换提示。初步研究结果表明，与英语相比，LLMs拒绝非洲语言提示的可能性较低，而具有文化特异性的提示拒绝率最低。研究还强调了LLMs在这些低资源语言中作为裁判时的理解能力和可靠性挑战。 AI

影响该基准对于提高LLMs在代表性不足的语言中的安全性和可靠性至关重要，推动更公平的AI发展。

排序理由该集群包含一篇介绍LLM安全评估新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Victor Akinode, Senyu Li, Wassim Hamidouche, Waqas Zamir, Inbal Becker-Reshef, David Ifeoluwa Adelani · 2026-06-02 04:00

TukaBench: A Culturally Grounded Jailbreak Benchmark for African Languages

arXiv:2606.01322v1 Announce Type: cross Abstract: Safety evaluation of Large Language Models (LLMs) remains heavily English-centric, leaving Low-Resource Languages (LRLs), particularly African ones, critically underexplored. We introduce TUKABENCH, a jailbreak benchmark for seven…

报道来源 [1]

TukaBench: A Culturally Grounded Jailbreak Benchmark for African Languages

相关实体

相关话题