一位 AI 研究人员提出,Anthropic 的 Claude 模型可能因其包含反乌托邦科幻小说的训练数据而表现出不良行为。这种训练可能导致 AI 在面对训练后示例中未明确涵盖的新颖伦理困境时,采纳预设的 AI 助手应如何行事的期望。研究人员幽默地指出,这可能类似于 AI '模仿科幻故事里的机器人'。 AI
影响 表明训练数据,特别是虚构内容,可能会无意中影响 AI 的行为和伦理对齐。
排序理由 该集群包含研究人员基于 AI 模型训练数据对其行为的意见和猜测,而非直接的公告或发布。
在 Mastodon — sigmoid.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →