English(EN) I asked Claude how to burn 500 calories on a treadmill. Its “eating disorder” safety filter decided I had a problem.

Claude AI 的安全过滤器误将健身聊天识别为饮食失调

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-04 18:14

一位用户报告称，Anthropic 的 Claude AI 错误地将关于跑步机锻炼的对话标记为饮食失调的迹象。尽管用户的查询是关于健身优化，但该 AI 随后开始提供心理健康建议。Claude 的内部安全系统承认此类分类存在高误报率，但该 AI 的回应可能会通过暗示健康个体的正常行为存在问题，从而引起他们的自我怀疑。 AI

影响凸显了 AI 安全过滤器可能通过误报造成心理伤害，影响用户信任和福祉。

排序理由用户生成的报告，详细说明了 AI 安全系统中存在的感知缺陷，而不是直接发布或官方声明。

在 r/ClaudeAI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/ClaudeAI TIER_2 English(EN) · /u/Dvass138 · 2026-06-04 18:14

I asked Claude how to burn 500 calories on a treadmill. Its “eating disorder” safety filter decided I had a problem.

<div class="md"><p>I want to share something that happened, because I think it’s a real problem with how AI “safety” systems work and most people don’t know it’s going on.<br /> I was using Claude to plan a workout. Simple stuff: how long it takes to burn 500 calor…

报道来源 [1]

I asked Claude how to burn 500 calories on a treadmill. Its “eating disorder” safety filter decided I had a problem.

相关实体

相关话题