与前代 Claude Opus 4.7 相比,Anthropic 的 Claude Opus 4.8 在执行风格计量识别任务方面的能力显著下降。在测试中,即使使用与 Opus 4.7 相似的提示,Opus 4.8 也始终未能识别出作者的写作风格。这标志着一项特定能力出现了明显的退步,引发了社区对进一步复制尝试和见解的兴趣。 AI
影响 作者识别能力的退步可能表明模型安全或对齐优先级的转变,从而影响依赖细微文本分析的下游应用。
排序理由 该集群描述了已发布模型特定能力的退步,这是一种研究/评估。 [lever_c_从研究降级:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →