English(EN) Sakana Trained One AI to Command GPT-5.5,

Sakana AI模型在SWE-Bench Pro上超越Claude Opus和GPT-5.5

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:51

总部位于东京的Sakana实验室开发了一个能够指挥GPT-5.5的AI模型，在SWE-Bench Pro基准测试中取得了73.7分。这一成绩超过了Anthropic的Claude Opus 4.8（得分为69.2）和OpenAI的GPT-5.5（得分为58.6）。该开发突显了AI代理能力和基准测试性能的进步。 AI

影响这一发展为AI代理在编码任务中的性能设定了新的基准，可能影响未来的模型开发和评估。

排序理由该条目报道了一个AI模型的新基准分数，这是一个研究里程碑。[lever_c_demoted from research: ic=1 ai=1.0]

在 Towards AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Sakana AI模型在SWE-Bench Pro上超越Claude Opus和GPT-5.5

报道来源 [1]

Towards AI TIER_1 English(EN) · Chew Loong Nian - AI ENGINEER · 2026-06-24 04:51

Sakana Trained One AI to Command GPT-5.5,

<div class="medium-feed-item"><p class="medium-feed-image"><a href="https://pub.towardsai.net/sakana-trained-one-ai-to-command-gpt-5-5-ed3725ba9187?source=rss----98111c9905da---4"><img src="https://cdn-images-1.medium.com/max/1200/1*5StdTHu9BxnSeFUGaBrPEw.png" width="1200" /></a>…

报道来源 [1]

Sakana Trained One AI to Command GPT-5.5,

相关实体

相关话题