PulseAugur
实时 13:39:29
实体 multi-agent debate

multi-agent debate

PulseAugur coverage of multi-agent debate — every cluster mentioning multi-agent debate across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_45776 ·

    大型语言模型注入检测器在领域伪装攻击下失效

    一项新的研究论文揭示了当前大型语言模型(LLM)安全系统的一个重大漏洞,称为伪装检测差距。当恶意注入的载荷被改写以模仿目标文档的领域特定语言和结构时,就会出现这种差距,导致标准检测器失效。例如,Llama 3.1 8B 的检测率从 93.8% 下降到 9.7%,Gemini 2.0 Flash 的检测率从 100% 下降到 55.6%,而专门的分类器 Llama Guard 3 则未能捕获任何伪装的载荷。此外,旨在作为防御手段的多代理…