最新的基准更新显示,OpenAI和Anthropic的模型表现相当,OpenAI与Anthropic打成平手。这一进展紧随GPT 5.6的最新预览。该基准还指出,中国模型预计无法赶上,而Gemini的表现数据仍在等待中。 AI
影响 此次基准更新表明领先的AI模型之间竞争激烈,可能影响未来的发展和采用策略。
排序理由 该集群讨论了比较AI模型的基准测试结果,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →