PulseAugur
实时 14:00:30
实体 Reins

Reins

PulseAugur coverage of Reins — every cluster mentioning Reins across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_96130 ·

    新的REINS方法在无需重新训练的情况下引导视频扩散模型实现安全

    研究人员开发了一种名为REINS(REpresentation-space INference-time Safety steering,表示空间推理时安全引导)的新型无需训练的方法,用于对齐视频扩散模型并防止生成不安全内容。该技术通过在推理时引导模型的内部表示来实现,而无需昂贵的安全微调。REINS识别模型隐藏状态中区分安全与不安全内容的特定方向,并通过将此方向添加到中间层,以最小的计算开销将有害生成重定向到安全替代方案。该方法已在…