研究人员开发了一个名为FBHM的新基准测试,以更好地评估视觉语言模型(VLM)在检测仇恨表情包方面的能力。现有的基准测试常常将修辞策略与目标社区特征混淆,阻碍了对VLM漏洞的因果分析。FBHM包含25种功能和10个目标社区的5000个表情包,揭示了当前最先进的VLM在此新数据集上的表现不佳,表明它们依赖于特定数据集的启发式方法,而非强大的多模态推理。为解决此问题,研究人员提出了LSV,一种使用少量(低至500个样本)数据的策略,可显著提高VLM在FBHM上的性能。 AI
影响 该基准测试有望推动更强大的多模态推理在AI中的发展,提高安全性并减少有害内容的生成。
排序理由 该集群包含一篇研究论文,介绍了一种用于评估AI模型的新基准测试和方法论。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →