一位 Mastodon 用户报告称 GPT-5.6 表现异常出色,特别是在智能体编码基准测试中,据称其性能优于 Anthropic 的 Mythos 模型。该用户还对这款新 GPT 模型的价格表示好奇。 AI
影响 在编码基准测试中可能出现新的 SOTA(state-of-the-art),可能会转移智能体开发的焦点。
排序理由 该集群包含用户关于模型性能的报告,而非模型创建者的官方发布或基准测试。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →