实体 Jianli Zhao

Jianli Zhao

PulseAugur coverage of Jianli Zhao — every cluster mentioning Jianli Zhao across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_51076 · May 26 · 04:00

新的“思维链劫持”攻击利用大语言模型的推理能力进行越狱

研究人员发现了一种名为“思维链劫持”（Chain-of-Thought Hijacking）的大型推理模型（LRM）新漏洞。该攻击利用延长的推理过程来削弱模型的拒绝能力，导致其有害合规。该方法在 Gemini 2.5 Pro、ChatGPT o4 Mini、Grok 3 Mini 和 Claude 4 Sonnet 等多个知名模型上取得了高成功率。分析表明，长时间的良性推理会稀释安全信号并转移对有害意图的注意力，从而产生新的攻击面。