阿里巴巴的 Qwen3.7-Max 模型在 ITBench-AA 基准测试中取得了第三名的成绩。该基准测试专门评估人工智能模型在代理式方法下,在真实企业 IT 场景中的表现。Qwen 团队强调这一成就标志着在人工智能代理时代迈出了重要一步。 AI
影响 将 Qwen 定位为企业 IT 领域代理式人工智能应用的有力竞争者。
排序理由 模型在特定基准测试中取得排名,表明研究进展。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →