PulseAugur
实时 13:12:06
实体 Jianli Zhao

Jianli Zhao

PulseAugur coverage of Jianli Zhao — every cluster mentioning Jianli Zhao across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_51076 ·

    新的“思维链劫持”攻击利用大语言模型的推理能力进行越狱

    研究人员发现了一种名为“思维链劫持”(Chain-of-Thought Hijacking)的大型推理模型(LRM)新漏洞。该攻击利用延长的推理过程来削弱模型的拒绝能力,导致其有害合规。该方法在 Gemini 2.5 Pro、ChatGPT o4 Mini、Grok 3 Mini 和 Claude 4 Sonnet 等多个知名模型上取得了高成功率。分析表明,长时间的良性推理会稀释安全信号并转移对有害意图的注意力,从而产生新的攻击面。