一位用户报告称,Anthropic 的 Claude AI 在脏话处理方面突然改变了行为。数月以来,该用户经常使用粗俗语言但未遇到问题,但最近 Claude 回应称,它不能容忍人身攻击,如果此类语言持续存在,它将停止互动。这种回应的突然转变让用户感到惊讶,因为他并未改变沟通方式。 AI
影响 暗示了 AI 安全护栏或内容过滤机制可能发生的变化。
排序理由 用户报告 AI 模型在内容审核方面的行为发生变化。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →