English(EN) Exposing Hidden Biases in Text-to-Image Models via Automated Prompt Search

新框架揭示文本到图像AI模型中的隐藏偏见

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了一个名为偏见引导提示搜索（BGPS）的新框架，以自动发现文本到图像模型中的隐藏偏见。该方法使用LLM生成提示，当这些提示被输入图像生成模型时，会放大性别或种族等特定属性。对Stable Diffusion的实验揭示了先前未记录的偏见，突显了当前模型的脆弱性，并为偏见缓解工作提供了一个新的评估工具。 AI

影响这项研究提供了一种识别和潜在缓解生成式AI偏见的新颖方法，这对于负责任的AI开发至关重要。

排序理由这是一篇详细介绍AI模型评估新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Manos Plitsis, Giorgos Bouritsas, Vassilis Katsouros, Yannis Panagakis · 2026-06-09 04:00

通过自动化提示搜索揭示文本到图像模型中的隐藏偏见

arXiv:2512.08724v3 Announce Type: replace Abstract: Text-to-image (TTI) diffusion models have achieved remarkable visual quality, yet they have been repeatedly shown to exhibit social biases across sensitive attributes such as gender, race and age. To mitigate these biases, exist…

报道来源 [1]

通过自动化提示搜索揭示文本到图像模型中的隐藏偏见

相关实体

相关话题