PulseAugur
实时 23:04:42
English(EN) RE: https:// infosec.exchange/@mttaggart/11 6830015225440372 "Attack memorization is inherently brittle; it only works against attacks the LLM already knows [..

LLM 安全脆弱,无法实现安全,讨论认为

Mastodon 上的一场讨论强调,当前 LLM 防范记忆攻击的安全性本质上是脆弱的。另一种方法,即角色感知,即 LLM 识别命令来自缺乏权限的角色,也存在缺陷。得出的结论是,LLM 无法实现安全,在实验室环境之外不应被认真对待。 AI

影响 表明当前的 LLM 存在根本性的安全缺陷,限制了它们的实际应用。

排序理由 该条目是关于 LLM 安全限制的社交媒体平台上的讨论。

在 Mastodon — sigmoid.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLM 安全脆弱,无法实现安全,讨论认为

报道来源 [1]

  1. Mastodon — sigmoid.social TIER_1 English(EN) · [email protected] ·

    RE: https:// infosec.exchange/@mttaggart/11 6830015225440372 "Attack memorization is inherently brittle; it only works against attacks the LLM already knows [..

    RE: https:// infosec.exchange/@mttaggart/11 6830015225440372 "Attack memorization is inherently brittle; it only works against attacks the LLM already knows [...] In contrast, role perception is the robust alternative. All the LLM needs to do is recognize that the command is in a…