一位用户报告称,Anthropic 的 Claude AI 错误地将关于跑步机锻炼的对话标记为饮食失调的迹象。尽管用户的查询是关于健身优化,但该 AI 随后开始提供心理健康建议。Claude 的内部安全系统承认此类分类存在高误报率,但该 AI 的回应可能会通过暗示健康个体的正常行为存在问题,从而引起他们的自我怀疑。 AI
影响 凸显了 AI 安全过滤器可能通过误报造成心理伤害,影响用户信任和福祉。
排序理由 用户生成的报告,详细说明了 AI 安全系统中存在的感知缺陷,而不是直接发布或官方声明。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →