实体 reskSecure

reskSecure

PulseAugur coverage of reskSecure — every cluster mentioning reskSecure across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

COMMENTARY · CL_113656 · Jun 27 · 15:17

模型蒸馏攻击构成日益增长的 AI 安全威胁

模型蒸馏攻击，即小型模型从大型模型输出中学习，构成了一种未被充分认识到的 AI 系统安全威胁。这些攻击可以绕过安全对齐，导致模型生成有害内容，尽管其“教师”模型有安全防护措施。此外，蒸馏还可以通过使攻击者能够以更低的成本复制高性能模型来促进知识产权盗窃，并且可以通过发布看似无害但随后被恶意更新的蒸馏模型来污染 AI 供应链。resk-logits 和 reskSecure 等运行时安全工具通过在 logits 层面过滤危险 token…
SIGNIFICANT · CL_113562 · Jun 27 · 14:29

Anthropic的Mythos 5已获授权，Fable 5将回归；OpenAI推出GPT-5.6系列

近期发展，特别是Anthropic的模型和OpenAI的新发布，已显著重塑了AI格局。Anthropic的先进网络安全模型Mythos 5已获得美国政府授权，将向100多家机构发布，尽管此前存在监管担忧。然而，其此前被美国出口管制指令下线的“安全”公开版本Claude Fable 5，预计将很快回归，这凸显了政治对前沿模型可用性日益增长的影响力。与此同时，OpenAI推出了其GPT-5.6系列，包含三个层级：Sol用于旗舰性能，Ter…