PulseAugur
实时 05:25:03
English(EN) Tmax-27b - a Qwen3.6-27b terminal agent for small GPUs trained with DPPO (RL)

Tmax-27B终端代理发布,针对消费级GPU进行优化

一款名为Tmax-27B的新终端代理模型已发布,该模型基于Qwen3.6-27B构建,并使用DPPO进行强化学习训练。该模型在Terminal Bench 2.0等代理基准测试中取得了有竞争力的分数。为了使Tmax-27B能够在消费级硬件上运行,创建了多种量化的GGUF版本,每权重量化范围从2到5位不等,并包含一个用于提高性能的推测解码头。 AI

影响 为拥有有限硬件的研究人员和开发者提供了一个更易于访问的、功能强大的终端代理版本。

排序理由 发布一款具有性能基准和量化细节以提高可访问性的新模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Tmax-27B终端代理发布,针对消费级GPU进行优化

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/professormunchies ·

    Tmax-27b - 一个基于Qwen3.6-27b、使用DPPO(RL)训练的小型GPU终端代理

    <!-- SC_OFF --><div class="md"><p>Hey everyone, wanted to share some work on making the new Tmax-27B terminal agent actually runnable on consumer hardware.</p> <p><strong>What is Tmax-27B?</strong> Ai2 just released Tmax, a family of terminal-agent LLMs trained with DPPO (RL) on …