阿里巴巴的 Qwen 3.7 Max 通过完成一项 35 小时的任务,展示了令人印象深刻的自主能力。在此次长时间运行中,该模型成功执行了 1,158 次工具调用。这种持续的表现已引起海外开发者的积极关注。 AI
影响 展示了先进的长期任务自主性和工具使用能力,可能支持更复杂的 AI 代理应用。
排序理由 Frontier-lab model release with system card. [lever_c_demoted from frontier_release: ic=2 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →