PulseAugur
实时 02:10:07
实体 SkillHarm

SkillHarm

PulseAugur coverage of SkillHarm — every cluster mentioning SkillHarm across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_65843 ·

    新基准揭示AI代理技能易受新型攻击

    研究人员开发了SkillHarm,一个用于评估AI代理技能安全漏洞的新基准。该基准包括两种攻击场景:固定载荷投毒(Fixed-Payload Poisoning),其中技能直接破坏任务;以及自变异投毒(Self-Mutating Poisoning),其中技能会随着时间推移而改变自身。SkillHarm包含71个技能的879个攻击样本,表明当前代理的成功率高达86.3%,存在漏洞。研究还强调,许多看似成功的防御措施是由于代理未与被投毒…

  2. TOOL · CL_83785 ·

    New benchmark reveals AI agents vulnerable to skill-based attacks

    Researchers have developed SkillHarm, a new benchmark designed to test the security of AI agents by evaluating skill-based attacks throughout their lifecycle. The benchmark includes automated methods for constructing po…