PulseAugur
实时 04:41:39
实体 HauntAttack

HauntAttack

PulseAugur coverage of HauntAttack — every cluster mentioning HauntAttack across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_111705 ·

    新的HauntAttack方法利用大型AI模型的推理漏洞

    研究人员开发了HauntAttack,这是一个旨在利用大型推理模型(LRM)中漏洞的新框架。这种攻击方法将有害指令嵌入基于推理的问题中,引导模型产生不安全的输出。在对11个LRM的测试中,HauntAttack的平均成功率超过70%,与先前的方法相比有了显著提高,并凸显了在AI开发中平衡高级推理能力与强大安全措施的持续挑战。