English(EN) Tmax-27b - a Qwen3.6-27b terminal agent for small GPUs trained with DPPO (RL)

Tmax-27B终端代理发布，针对消费级GPU进行优化

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-23 19:05

一款名为Tmax-27B的新终端代理模型已发布，该模型基于Qwen3.6-27B构建，并使用DPPO进行强化学习训练。该模型在Terminal Bench 2.0等代理基准测试中取得了有竞争力的分数。为了使Tmax-27B能够在消费级硬件上运行，创建了多种量化的GGUF版本，每权重量化范围从2到5位不等，并包含一个用于提高性能的推测解码头。 AI

影响为拥有有限硬件的研究人员和开发者提供了一个更易于访问的、功能强大的终端代理版本。

排序理由发布一款具有性能基准和量化细节以提高可访问性的新模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/professormunchies · 2026-06-23 19:05

Tmax-27b - 一个基于Qwen3.6-27b、使用DPPO（RL）训练的小型GPU终端代理

<div class="md">Hey everyone, wanted to share some work on making the new Tmax-27B terminal agent actually runnable on consumer hardware. What is Tmax-27B? Ai2 just released Tmax, a family of terminal-agent LLMs trained with DPPO (RL) on …

报道来源 [1]

Tmax-27b - 一个基于Qwen3.6-27b、使用DPPO（RL）训练的小型GPU终端代理

相关实体

相关话题