PulseAugur
实时 09:35:23
实体 ContextualJailbreak

ContextualJailbreak

PulseAugur coverage of ContextualJailbreak — every cluster mentioning ContextualJailbreak across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_15906 ·

    新的红队测试方法ContextualJailbreak绕过了LLM安全对齐

    研究人员开发了ContextualJailbreak,这是一种旨在发现大型语言模型漏洞的进化红队测试策略。这种黑盒方法使用模拟的多轮对话和分级危害评分来指导其寻找越狱攻击。该方法在多个开源模型上实现了100%的攻击成功率,并表现出对闭源前沿模型的显著可迁移性,尽管在不同提供商之间的鲁棒性存在显著差异。