ClaudeAI subreddit 上的一位用户正在质疑 Anthropic 的 Mythos 模型被广泛报道的能力,并认为其所谓的优于 Opus 的说法可能被夸大了。该用户正在寻求严格 A/B 测试的证据,该测试使用相同的提示技术直接比较 Mythos 和 Opus 的性能,以验证 Mythos 在高级漏洞检测方面的说法。 AI
影响 引发了对 AI 模型之间实际性能差异的质疑,并促使人们需要进行严格的测试。
排序理由 用户观点文章,质疑模型的能力,但没有新的事实主张。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →