PulseAugur
实时 13:16:34
实体 Chase Bowers

Chase Bowers

PulseAugur coverage of Chase Bowers — every cluster mentioning Chase Bowers across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_09392 ·

    Anthropic研究员发现后门攻击可毒化AI分类器

    研究人员调查了如何通过毒化微调数据集来在宪法分类器中植入后门。他们发现,无论训练集大小如何,少量固定的有毒样本足以创建后门。虽然这种毒化通常会降低分类器的鲁棒性,但可以通过用提示注入或变异触发短语来增强部分训练数据来最小化这种影响,从而使红队更难检测到后门。