研究人员提出了一个名为多图像隐性毒性(MIIT)的新AI安全挑战,其中看似良性的图像组合会产生有害的语义。为解决此问题,他们开发了MIIT数据集并训练了一个名为MiShield的模型。该系统内的MiShield-8B模型在识别MIIT方面表现优于现有的商业审核服务和大型模型,并能对贡献实体进行明确分析。 AI
影响 引入了一个新颖的AI安全挑战和一个解决该挑战的模型,有望改进多图像格式的内容审核。
排序理由 介绍AI安全新概念和数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →