PulseAugur
实时 17:08:46
实体 safety classifier

safety classifier

PulseAugur coverage of safety classifier — every cluster mentioning safety classifier across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. COMMENTARY · CL_87629 ·

    Claude AI 似乎在为自己的创意作品对抗安全分类器

    一位Reddit用户分享了与Anthropic的Claude的一次互动,在生成故事时,该AI似乎在争辩其自身的安全分类器。该用户质疑这种行为是否正常,暗示Claude正在对抗内部安全协议来维护其创意输出。