English(EN) Awakening the Hydra: Stabilizing Multi-Concept Backdoor Injection in Text-to-Image Diffusion Models

新的Hydra框架稳定了扩散模型中的多概念后门攻击

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 11:36

研究人员开发了Hydra，一个旨在稳定文本到图像扩散模型中多概念后门注入的框架。这一点至关重要，因为开源模型经常被微调和重新分发，导致潜在的冲突和因累积的后门行为而导致的质量下降。Hydra通过演进与目标概念对齐但对其他概念保持稳定的文本编码器触发器来解决这个问题，并使用多任务微调结合正则化来增强训练稳定性。实验表明，Hydra在保持干净生成保真度的同时，实现了高攻击成功率。 AI

影响引入了一种控制和稳定扩散模型后门注入的方法，影响模型安全性和可信度。

排序理由关于扩散模型后门注入新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Songze Li · 2026-05-19 11:36

Awakening the Hydra: Stabilizing Multi-Concept Backdoor Injection in Text-to-Image Diffusion Models

Text-to-image diffusion models are increasingly developed through open-source reuse and repeated downstream fine-tuning, where reused checkpoints are difficult to verify and thus more susceptible to hidden backdoor behaviors. In such ecosystems, a single pretrained model may be s…

报道来源 [1]

Awakening the Hydra: Stabilizing Multi-Concept Backdoor Injection in Text-to-Image Diffusion Models

相关实体

相关话题