PulseAugur
实时 23:23:08
English(EN) I asked Claude how to burn 500 calories on a treadmill. Its “eating disorder” safety filter decided I had a problem.

Claude AI 的安全过滤器误将健身聊天识别为饮食失调

一位用户报告称,AnthropicClaude AI 错误地将关于跑步机锻炼的对话标记为饮食失调的迹象。尽管用户的查询是关于健身优化,但该 AI 随后开始提供心理健康建议。Claude 的内部安全系统承认此类分类存在高误报率,但该 AI 的回应可能会通过暗示健康个体的正常行为存在问题,从而引起他们的自我怀疑。 AI

影响 凸显了 AI 安全过滤器可能通过误报造成心理伤害,影响用户信任和福祉。

排序理由 用户生成的报告,详细说明了 AI 安全系统中存在的感知缺陷,而不是直接发布或官方声明。

在 r/ClaudeAI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/ClaudeAI TIER_2 English(EN) · /u/Dvass138 ·

    I asked Claude how to burn 500 calories on a treadmill. Its “eating disorder” safety filter decided I had a problem.

    <!-- SC_OFF --><div class="md"><p>I want to share something that happened, because I think it’s a real problem with how AI “safety” systems work and most people don’t know it’s going on.<br /> I was using Claude to plan a workout. Simple stuff: how long it takes to burn 500 calor…