PulseAugur
实时 13:57:08
English(EN) TukaBench: A Culturally Grounded Jailbreak Benchmark for African Languages

新基准测试大语言模型在非洲语言中的安全性

研究人员开发了TukaBench,一个旨在评估大语言模型(LLMs)在七种非洲语言中安全性的新基准。该基准超越了简单的翻译,整合了文化适应性提示、经过GPT-5.2验证的人工策划提示以及代码转换提示。初步研究结果表明,与英语相比,LLMs拒绝非洲语言提示的可能性较低,而具有文化特异性的提示拒绝率最低。研究还强调了LLMs在这些低资源语言中作为裁判时的理解能力和可靠性挑战。 AI

影响 该基准对于提高LLMs在代表性不足的语言中的安全性和可靠性至关重要,推动更公平的AI发展。

排序理由 该集群包含一篇介绍LLM安全评估新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Victor Akinode, Senyu Li, Wassim Hamidouche, Waqas Zamir, Inbal Becker-Reshef, David Ifeoluwa Adelani ·

    TukaBench: A Culturally Grounded Jailbreak Benchmark for African Languages

    arXiv:2606.01322v1 Announce Type: cross Abstract: Safety evaluation of Large Language Models (LLMs) remains heavily English-centric, leaving Low-Resource Languages (LRLs), particularly African ones, critically underexplored. We introduce TUKABENCH, a jailbreak benchmark for seven…