OpenAI 预览了其新的 GPT-5.6 模型系列,其中包括 Sol Ultra、Sol、Terra 和 Luna。GPT-5.6 Sol Ultra 模型在 TerminalBench 2.1 基准测试中取得了 91.9% 的分数,超过了 Anthropic 的 Claude Mythos 5,后者的得分为 88.0%。Terra 模型提供了与 GPT-5.5 相当的性能,但成本更低,而 Luna 被定位为最具经济效益的选择。新系列还通过 max reasoning 和 ultra 模式引入了增强的推理能力。预计将在未来几周内全面上市,并首先向受信任的合作伙伴进行有限的推出。 AI
影响 在编码基准测试中设定了新的 SOTA;给 Anthropic 带来回应压力。
排序理由 前沿实验室模型发布,附带系统卡。[lever_c 从 frontier_release 降级:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →