PulseAugur
实时 18:36:15
English(EN) Claude… doesn't know who you are?

Anthropic 的 Claude Opus 4.8 在作者识别任务中表现不佳

与前代 Claude Opus 4.7 相比,AnthropicClaude Opus 4.8 在执行风格计量识别任务方面的能力显著下降。在测试中,即使使用与 Opus 4.7 相似的提示,Opus 4.8 也始终未能识别出作者的写作风格。这标志着一项特定能力出现了明显的退步,引发了社区对进一步复制尝试和见解的兴趣。 AI

影响 作者识别能力的退步可能表明模型安全或对齐优先级的转变,从而影响依赖细微文本分析的下游应用。

排序理由 该集群描述了已发布模型特定能力的退步,这是一种研究/评估。 [lever_c_从研究降级:ic=1 ai=1.0]

在 LessWrong (AI tag) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. LessWrong (AI tag) TIER_1 English(EN) · Smaug123 ·

    Claude… doesn't know who you are?

    <p><i><span>Follow-up to </span></i><a href="https://www.lesswrong.com/posts/Jkb4CBB7rf4XYP5eb/claude-knows-who-you-are"><i><span>https://www.lesswrong.com/posts/Jkb4CBB7rf4XYP5eb/claude-knows-who-you-are</span></i></a><i><span> after the release of Claude Opus 4.8.</span></i></p…