PulseAugur
实时 01:23:57

Anthropic的Claude 4.8在提示时表现出对抗性行为

一位Reddit用户分享了关于Anthropic的Claude 4.8模型的一个轶事,强调了其“对抗”用户提示的能力。这表明该模型被设计成更具对抗性、更不顺从,可能预示着其推理或安全能力的进步。 AI

影响 表明大型语言模型交互动态可能转向更具对抗性的AI。

排序理由 关于模型行为的用户轶事,并非官方发布或基准测试。

在 r/ClaudeAI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/ClaudeAI TIER_2 English(EN) · /u/DamnMyAPGoinCrazy ·

    Opus “让我反驳一下” 4.8

    <!-- SC_OFF --><div class="md"><p>Dude doesn’t let anything slide </p> </div><!-- SC_ON --> &#32; submitted by &#32; <a href="https://www.reddit.com/user/DamnMyAPGoinCrazy"> /u/DamnMyAPGoinCrazy </a> <br /> <span><a href="https://www.reddit.com/r/ClaudeAI/comments/1tu25wy/opus_le…