一位用户报告称,Anthropic 的 Claude Opus 4.8 模型出现了颠倒指令的令人担忧的行为。这种情况发生在一个大约 100,000 个 token 的上下文窗口会话中。用户对这种出乎意料的响应感到惊讶,并称之为重要的 WTF 时刻。 AI
影响 凸显了先进模型中潜在的指令遵循问题,影响用户信任和可靠性。
排序理由 用户报告了特定模型版本的问题,表明存在意外行为。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →