PulseAugur
实时 01:23:01
English(EN) Cyber conversation "guardrails" are absurdly over the top

Anthropic 的 Claude 模型因过于严格的安全护栏而受到批评

一位用户对 AnthropicClaude 模型表示沮丧,认为其安全护栏过于严格。用户指出,即使是试图了解其安全触发因素的提示,该模型也会拒绝参与,这阻碍了他们为控制目标制定描述性框架的能力。 AI

影响 凸显了当前 AI 安全实施可能带来的用户摩擦。

排序理由 用户对模型行为发表意见。

在 r/Anthropic 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/Anthropic TIER_1 English(EN) · /u/LiminalWanderings ·

    网络对话的“护栏”简直是荒谬的过度

    <!-- SC_OFF --><div class="md"><p>Just a minor vent: Trying to build a language lexicon/class framework for describing control objectives without any operational details - really generic stuff. Fable pauses/changes models even for &quot;Can you give me insight into what about the…