一款名为Tmax-27B的新终端代理模型已发布,该模型基于Qwen3.6-27B构建,并使用DPPO进行强化学习训练。该模型在Terminal Bench 2.0等代理基准测试中取得了有竞争力的分数。为了使Tmax-27B能够在消费级硬件上运行,创建了多种量化的GGUF版本,每权重量化范围从2到5位不等,并包含一个用于提高性能的推测解码头。 AI
影响 为拥有有限硬件的研究人员和开发者提供了一个更易于访问的、功能强大的终端代理版本。
排序理由 发布一款具有性能基准和量化细节以提高可访问性的新模型。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →