新框架增强了文本到图像扩散模型的安全引导

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-28 15:00

研究人员推出了一种名为 SafeDIG 的新颖框架，旨在增强文本到图像扩散 Transformer 的安全引导。该方法通过将安全适应制定为位置感知稀疏特征传输，来解决分层生成过程中控制有害内容的挑战。SafeDIG 优先考虑稳定的干预位点，并将可转移的安全特征与特定领域的激活分离开来，从而在不同风险领域实现更可靠的引导。在 FLUX.1 Dev 和 Stable Diffusion 3.5 Large 上的实验表明，SafeDIG 在保持图像质量的同时有效降低了不安全生成率。 AI

影响这项研究可能带来更强大的生成式 AI 安全机制，降低生成有害内容的风险。

排序理由该集群包含一篇学术论文，详细介绍了用于 AI 安全的新研究框架。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Zihao Xue, Yan Wang, Zhen Bi, Long Ma, Zhonglong Zheng, Zeyu Yang, Bingyu Zhu, Longtao Huang, Jie Xiao, Jungang Lou · 2026-05-29 04:00

Robust and Generalizable Safety Steering for Text-to-Image Diffusion Transformers

arXiv:2605.30049v1 Announce Type: new Abstract: Diffusion Transformers have become a powerful backbone for text-to-image generation, but their layered and cross-modal generation process makes safety control fundamentally different from prompt-level filtering or output-level detec…
arXiv cs.AI TIER_1 English(EN) · Jungang Lou · 2026-05-28 15:00

Robust and Generalizable Safety Steering for Text-to-Image Diffusion Transformers

Diffusion Transformers have become a powerful backbone for text-to-image generation, but their layered and cross-modal generation process makes safety control fundamentally different from prompt-level filtering or output-level detection. Harmful semantics may be weakly expressed …

报道来源 [2]

Robust and Generalizable Safety Steering for Text-to-Image Diffusion Transformers

Robust and Generalizable Safety Steering for Text-to-Image Diffusion Transformers

相关实体

相关话题