阿里巴巴的 Qwen3.7-Max 在 AI 编程能力方面取得了重要里程碑,在 Code Arena 排行榜上以 1541 分位居全球第二。这使其仅次于 Anthropic 的 Claude 系列,并领先于 GPT-5.5 和 Gemini-3.5-Flash 等知名模型。Code Arena 评估模型生成完整、交互式 Web 应用程序的能力,这与传统的编码基准测试不同。Qwen3.7-Max 的表现凸显了其在编码、智能体和长上下文任务方面的先进能力,开发者指出其与竞争对手相比,自主执行能力和成本效益令人印象深刻。 AI
影响 为 AI 编程能力树立了新的标杆,挑战了现有领导者,并凸显了在自主任务完成方面的进步。
排序理由 该集群报告了一个 AI 模型在备受尊敬的编程排行榜上的新基准测试结果。
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →