PulseAugur
实时 22:16:11
Русский(RU) 250 документов ломают любой ИИ: атака, от которой нет защиты Совместное исследование Anthropic, британского AI Security Institute и Института Алана Тьюринга над

Anthropic、AI安全研究所和Turing研究所揭示AI漏洞

来自Anthropic、英国AI安全研究所和Alan Turing研究所的研究人员发现了一个AI模型的新漏洞。他们发现,250份特定文件可用于触发一种攻破防御的攻击,从而使AI系统易受攻击。这项研究突显了当前AI技术面临的重大安全挑战。 AI

影响 识别出一种可能破坏AI模型防御的新型攻击向量,需要新的安全协议。

排序理由 学术研究论文,详细介绍了一个新的AI漏洞。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Anthropic、AI安全研究所和Turing研究所揭示AI漏洞

报道来源 [1]

  1. Mastodon — mastodon.social TIER_1 Русский(RU) · [email protected] ·

    250 documents break any AI: an attack with no defense Joint research by Anthropic, the UK AI Security Institute, and the Alan Turing Institute on

    250 документов ломают любой ИИ: атака, от которой нет защиты Совместное исследование Anthropic, британского AI Security Institute и Института Алана Тьюринга наделало шума. Команды показали, что для создания скрытого бэкдора в языковой модели достаточно подсунуть в обучающий датас…