PulseAugur
实时 11:17:10
实体 PAST2HARM

PAST2HARM

PulseAugur coverage of PAST2HARM — every cluster mentioning PAST2HARM across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_56291 ·

    新的PAST2HARM攻击利用过去时态越狱多模态人工智能

    研究人员开发了PAST2HARM,一种新颖的越狱技术,通过将提示重塑为过去时态来利用多模态人工智能系统的漏洞。该方法系统地绕过了文本到图像模型的拒绝训练,在Gemini Nano Banana Pro、GPT Image 2和SD XL等各种模型上展示了高攻击成功率。该攻击可以引发包括露骨内容、虚假信息和仇恨言论在内的各种有害内容,凸显了当前人工智能安全措施的基本弱点。