研究人员开发了一个名为StylisticBias的新基准,用于评估多模态大型语言模型(MLLM)中的社会偏见。该基准使用了大约25,000张图像,这些图像通过改变500张基础人脸的单一视觉属性生成,旨在保持身份不变的情况下,分离特定线索对模型判断的影响。研究发现,年龄和体型显著影响模型感知,而时尚风格和其他视觉属性驱动了最大的属性级别变化。值得注意的是,大约15个属性的小集合占了偏见总变异的近80%,这表明偏见集中在少数视觉线索上,特别是对于与外观语义对齐的判断。 AI
影响 识别出不成比例地影响人工智能模型偏见的特定视觉属性,从而能够制定有针对性的缓解策略。
排序理由 该集群基于一篇提交的学术论文,该论文介绍了一个用于评估人工智能模型的新基准。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →