Anthropic 正在准备发布其新的 Mythos 级模型,这些模型在进攻性安全能力方面取得了显著飞跃,发现的 Firefox 漏洞数量是之前 Opus 模型数量的 90 倍。然而,该公司也改进了其 Opus 4.8 模型,使其在对齐分数上与 Mythos 相当,使其成为通用编码任务的合适且更具成本效益的选择。Mythos 的定价预计将是 Opus 的五倍,这使其适用于专业的安全审计和自主研究,而不是常规的开发工作。 AI
影响 Mythos 先进的安全能力可能会彻底改变漏洞研究,而 Opus 4.8 改进的对齐性为通用开发提供了更具成本效益的选择。
排序理由 该集群讨论了一个新模型类别的发布,该发布在基准测试方面有显著改进,并且来自主要 AI 实验室的定价策略。[lever_c_demoted from significant: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →