研究人员推出了一种名为 SafeDIG 的新颖框架,旨在增强文本到图像扩散 Transformer 的安全引导。该方法通过将安全适应制定为位置感知稀疏特征传输,来解决分层生成过程中控制有害内容的挑战。SafeDIG 优先考虑稳定的干预位点,并将可转移的安全特征与特定领域的激活分离开来,从而在不同风险领域实现更可靠的引导。在 FLUX.1 Dev 和 Stable Diffusion 3.5 Large 上的实验表明,SafeDIG 在保持图像质量的同时有效降低了不安全生成率。 AI
影响 这项研究可能带来更强大的生成式 AI 安全机制,降低生成有害内容的风险。
排序理由 该集群包含一篇学术论文,详细介绍了用于 AI 安全的新研究框架。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →