English(EN) Do Models Share Safety Representations? Cross-Model Steering for Safe Visual Generation

AI安全方向可在无不安全数据的情况下跨模型迁移

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 04:00

研究人员开发了一种新颖的生成式AI跨模型安全引导框架，使得安全控制可以在不同模型之间迁移，而无需在目标模型上使用不安全数据。该方法从源模型学习一个可移植的安全潜在方向，并将其应用于目标生成器，同时保持生成质量。该方法还包括一个用于类别特定安全控制的多向量扩展，为AI安全机制提供了一条模块化和可重用的路径。 AI

影响实现了更高效、可移植的AI安全控制，减少了在敏感数据上进行大量再训练的需求。

排序理由学术论文，详细介绍了一种新的AI安全方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

arXiv
LLM

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Tobia Poppi, Silvia Cappelletti, Sara Sarto, Florian Schiffers, Garin Kessler, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara · 2026-06-05 04:00

模型是否共享安全表征？跨模型引导安全视觉生成

arXiv:2606.05290v1 Announce Type: new Abstract: Recent progress in generative modeling has made safety control a central challenge, yet existing approaches remain largely model-specific, requiring retraining or tailored interventions for each new architecture. In this work, we as…

报道来源 [1]

模型是否共享安全表征？跨模型引导安全视觉生成

相关实体

相关话题