两篇新的研究论文介绍了在自回归图像生成模型中擦除概念的方法,以解决滥用和创建不安全内容的担忧。第一篇论文Obliviate提出了一种针对这些模型的基于引导的方法,侧重于视觉令牌分布和轨迹级别更新。它在基准数据集上显著减少了裸露内容,同时保持了模型的整体效用。第二篇论文ScaleErasure提供了一种推理时干预方法,该方法针对特定logit来克服下一尺度自回归模型中的语义纠缠,在保持生成能力的同时提高了概念擦除的精度。 AI
影响 这些方法可以增强生成式AI的安全性和可控性,减少自回归图像生成中被滥用的可能性。
排序理由 两篇在arXiv上发表的学术论文,介绍了图像生成模型中概念擦除的新方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →