PulseAugur
实时 02:31:17
English(EN) Thoughts of the leaked GPT-5-6 Models?

OpenAI 预览 GPT-5.6 系列,Sol Ultra 在 TerminalBench 上超越 Mythos 5

OpenAI 预览了其新的 GPT-5.6 模型系列,其中包括 Sol UltraSol、Terra 和 Luna。GPT-5.6 Sol Ultra 模型在 TerminalBench 2.1 基准测试中取得了 91.9% 的分数,超过了 Anthropic 的 Claude Mythos 5,后者的得分为 88.0%。Terra 模型提供了与 GPT-5.5 相当的性能,但成本更低,而 Luna 被定位为最具经济效益的选择。新系列还通过 max reasoning 和 ultra 模式引入了增强的推理能力。预计将在未来几周内全面上市,并首先向受信任的合作伙伴进行有限的推出。 AI

影响 在编码基准测试中设定了新的 SOTA;给 Anthropic 带来回应压力。

排序理由 前沿实验室模型发布,附带系统卡。[lever_c 从 frontier_release 降级:ic=1 ai=1.0]

在 r/cursor 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

OpenAI 预览 GPT-5.6 系列,Sol Ultra 在 TerminalBench 上超越 Mythos 5

报道来源 [1]

  1. r/cursor TIER_2 English(EN) · /u/Complete-Sea6655 ·

    关于泄露的 GPT-5-6 模型有什么看法?

    <table> <tr><td> <a href="https://www.reddit.com/r/cursor/comments/1ugg8t2/thoughts_of_the_leaked_gpt56_models/"> <img alt="Thoughts of the leaked GPT-5-6 Models?" src="https://preview.redd.it/q04vakowfo9h1.jpeg?width=640&amp;crop=smart&amp;auto=webp&amp;s=57074d089512b5da521274f…