PulseAugur
实时 05:37:53
English(EN) KSAFE-MM: A Multimodal Safety Benchmark via Localized Contextualization for Korean Cultural Risks

新基准 KSAFE-MM 在韩国文化背景下测试 MLLM 安全性

研究人员开发了 KSAFE-MM,这是一个旨在评估多模态大语言模型 (MLLM) 在韩国文化背景下安全性的新基准。现有的 MLLM 安全工具常常受限于其以英语为中心以及缺乏对本地文化细微差别的关注。KSAFE-MM 通过利用本地化的视觉和文本查询来评估通用和特定文化风险,从而揭示漏洞,解决了这一问题。 AI

影响 强调了对 MLLM 进行特定文化安全评估的必要性,超越了以英语为中心的做法。

排序理由 该集群描述了一篇介绍用于评估人工智能安全性的基准的新学术论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Yongwoo Kim, Sojung An, Yunjin Park, Jungwon Yoon, Dujin Lee, HyunBeom Cho, Jaewon Lee, Wonhyuk Lee, Youngchol Kim, JeongYeop Kim, Donghyun Kim ·

    KSAFE-MM:通过本地化语境化应对韩国文化风险的多模态安全基准

    arXiv:2605.28013v1 Announce Type: new Abstract: Multimodal Large Language Models (MLLMs) exacerbate safety risks by introducing vulnerabilities across multiple modalities, such as language and vision. Current MLLM safety evaluation tools, however, suffer from major limitations: 1…

  2. Hugging Face Daily Papers TIER_1 English(EN) ·

    KSAFE-MM:通过本地化语境化来应对韩语文化风险的多模态安全基准

    Multimodal Large Language Models (MLLMs) exacerbate safety risks by introducing vulnerabilities across multiple modalities, such as language and vision. Current MLLM safety evaluation tools, however, suffer from major limitations: 1) English-centric dataset construction, and 2) a…