Qwen 3.6 27B 模型在 DeepSWE 基准测试中取得了 1.79% 的分数,在 20 个模型中排名第 18 位。此次基准测试运行耗时 70 小时,使用了 RTX6000 Pro Blackwell GPU 和 262k 上下文窗口。尽管社区普遍认为该模型输出冗长,但其输出 token 与类似模型相当,并且被认为是与 Kimi 等领先的闭源模型相比,一个强大的本地化选项。 AI
影响 为一款开源模型提供了性能基准,表明其在本地 LLM 生态系统中相对于其他模型的能力。
排序理由 该集群报告了一款开源模型的特定基准测试结果,属于研究范畴。[lever_c_从研究降级:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →