实体 Qwen-3.6 27B

Qwen-3.6 27B

PulseAugur coverage of Qwen-3.6 27B — every cluster mentioning Qwen-3.6 27B across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 68

发布 · 30天

90 天内 0

论文 · 30天

90 天内 6

层级分布 · 90 天

research 4
tool 43
commentary 14
meme 7

主题

模型发布 41
基础设施 32
产品 27
其他 11
论文 6
安全 1
政策 1

关系

used by Multi Token Prediction 90%
instance of Qwen 3.6:35B 90%
competes with Gemma-4 31B 70%
competes with Qwen 3.6:35B 70%
competes with Gemma 4: 26b 70%
used by BeeLlama.cpp 70%
competes with GLM-5.2 60%
used by Gemma 4: 26b 50%
developed by Multi Token Prediction 50%
used by Gemma-4 31B 50%

时间线

2026-06-21 product_launch A modified version of the Qwen 3.6 27B model, with reduced safety alignment, has been released. 来源

情绪 · 30 天

20 天有情绪数据

最近 · 第 1/4 页 · 共 68 条

TOOL · CL_132675 · Jul 8 · 17:55

用户发布 140GB GLM-5.2 编码量化版供测试

一位用户创建了 GLM-5.2 模型的一个 140 GB IQ2_XXS REAP 量化版本，专门针对编码任务进行了优化。此量化版本基于“最受欢迎的 REAP”，可在 Hugging Face 上找到。创建者正在寻找测试者，并想了解它与 Qwen 3.6 27b 和 DeepSeek Flash v4 等其他模型的比较情况。
TOOL · CL_130652 · Jul 7 · 16:40

DFlash 将 llama.cpp 中 Qwen 3.6 27B 的性能提升了 4.44 倍

Reddit 的 r/LocalLLaMA 论坛上的一位用户分享了在使用 llama.cpp 中新合并的 DFlash 功能时 Qwen 3.6 27B 模型的性能基准测试。在 RTX 6000 PRO 上进行的测试显示，与之前的方法相比，在 36K 上下文长度下速度显著提高了 4.44 倍。DFlash 功能利用带有块扩散草稿器的投机解码，一次性填充 token 块，提高了效率。
COMMENTARY · CL_128403 · Jul 7 · 02:24

用户报告称 Qwen 3.6 27B 模型在代理任务中遇到困难

Reddit 的 r/LocalLLaMA 论坛上一位用户报告称，Qwen 3.6 27B 模型在执行代理任务时遇到了严重问题。尽管与前代模型相比，该模型在生成令人印象深刻的单轮提示和长内容方面表现出色，但在多轮代理工作中却持续失败。用户经历了持续的错误和不遵守指令的情况，模型大约每四轮就会犯下“愚蠢”的错误。这导致用户在代理工作流中回退到使用旧的 Qwen 3.5 122B 模型。
TOOL · CL_128137 · Jul 7 · 00:10

Qwen 3.6 27B 模型通过多令牌预测 (Multi Token Prediction) 将速度提升一倍

一位 Reddit r/LocalLLaMA 版块的用户分享了他们在运行 Qwen 3.6 27B 模型时使用多令牌预测 (MTP) 的积极体验。他们报告称，实施 MTP 后，每秒令牌数有效地翻了一番，这促使他们寻找其他针对此技术进行了优化的模型。
RESEARCH · CL_128121 · Jul 6 · 20:59

Anthropic 发布内部 LLM 工作空间 'J-space'，支持新的可解释性工具 · 跟踪 9 个来源

Anthropic 发布了一项研究，详细介绍了其 Claude 等语言模型内部的“J-space”，一个内部的“全局工作空间”。该工作空间在处理过程中充当中间变量的无声临时内存，类似于人类认知。一种名为 Jacobian lens (J-lens) 的新工具允许研究人员访问和分析这个 J-space，揭示它在更高阶推理中起着至关重要的作用，尽管它仅占模型整体活动的一小部分。J-space 的存在和 J-lens 的效用已在 Qwen …
TOOL · CL_126627 · Jul 5 · 18:43

Qualcomm推出GenieX，可在Windows笔记本上运行LLM

Qualcomm推出了GenieX，这是一个新的SDK，旨在促进大型语言模型（LLM）在Windows笔记本上的运行。早期性能测试显示速度令人鼓舞，在使用笔记本的GPU或NPU时，Gemma 4 26B达到了20 tokens/sec，Qwen 3.6 27B达到了10 tokens/sec。该平台还支持通过llama.cpp运行模型，为各种GGUF模型提供CPU、GPU和NPU加速。
TOOL · CL_126621 · Jul 5 · 14:06

Qwen 3.6 27B VLLM 基准测试显示 NVFP4 在令牌生成方面表现最佳，FP8 在预填充方面表现最佳

Reddit 的 r/LocalLLaMA 版块的一位用户分享了 Qwen 3.6 27B 模型使用 VLLM 的基准测试结果。测试比较了不同量化格式的性能：BF16、FP8 和 NVFP4。NVFP4 由于内存带宽需求降低，展示了最快的令牌生成速度，比 BF16 快约 2.6 倍。FP8 在提示处理和预填充速度方面表现优异，比 BF16 快约 20%，因为它利用 Tensor Core 加速来处理计算密集型任务。
TOOL · CL_125490 · Jul 4 · 18:51

HexGrid Cloud 为开放权重模型提供定制化 LLM GPU 基准测试服务

HexGrid Cloud 提供在用户指定的 GPU 和配置上对开放权重 LLM 进行基准测试的服务。他们正在征集模型和硬件设置的建议，以测试其部署平台，重点关注适合单个 H200 GPU 内存的聊天/指令模型。测试结果将包括吞吐量、延迟和成本指标，并将与完整的配置细节一起公开分享，以确保可复现性。
COMMENTARY · CL_125254 · Jul 4 · 13:56

爱好者勾勒本地开源大语言模型的理想未来

一位爱好者分享了他对开源本地大语言模型（LLMs）未来发展的愿望清单和预测。他对Qwen 3.6 27B和DeepSeek V4等现有模型感到兴奋，并设想了未来的进步，例如充分利用GPU容量、改进的混合专家（MoE）架构以实现更高效的知识分配以及新颖的数据布局。作者还推测开源模型有可能提供更高的训练数据和令牌权限透明度，从而带来更强大、更可控的AI应用。
TOOL · CL_124526 · Jul 3 · 20:23

SwiReasoning 技术提高了 LLM 的速度和准确性，用户质疑其采用

据报道，SwiReasoning 是一种大约九个月前开发的技术，它正在增强 Qwen 3.6 27b 等大型语言模型的性能。用户观察到，尽管每秒 token 数可能有所下降，但 SwiReasoning 能带来更准确的答案和显著更快的响应时间。该技术的有效性和广泛采用正受到质疑，用户想知道为什么它不更普遍。
MEME · CL_124531 · Jul 3 · 20:16

用户寻求以 5-10 token/秒的速度运行 Qwen 3.6 27B 模型的廉价设置

一位 Reddit r/LocalLLaMA 社区的用户正在寻求关于如何高效运行 Qwen 3.6 27B 模型的建议。他们特别希望在不使用推测解码的情况下，以尽可能便宜的设置实现每秒 5-10 个 token 的速度。用户提到为此目的使用 DFlash 或 DSpark 等技术。
COMMENTARY · CL_120604 · Jul 1 · 18:01

Deepseek Flash V4 对比 Qwen 3.6 27B：用户寻求性能基准

一位 Reddit 用户正在寻找 Deepseek Flash V4 和 Qwen 3.6 27B 模型之间的基准测试和性能比较，特别询问它们在速度、编码和推理方面的能力。该帖子旨在收集社区见解，以确定哪个模型可能在这些任务上提供更优越的性能。
COMMENTARY · CL_120616 · Jul 1 · 16:04

本地LLM用户寻求关于最大化编码任务上下文窗口的建议

一位用户在 r/LocalLLaMA 子版块上寻求关于最大化本地LLM使用上下文窗口大小的建议，特别是针对编码任务。他们目前在单块3090 GPU（24GB显存）上使用Qwen 3.6 27B模型，在启动程序消耗24K后，其有效上下文窗口限制在34K个token左右。该用户正在探索在上下文空间和处理能力方面获得更高“性价比”的选项，并考虑是等待更强大的硬件还是优化当前设置。
TOOL · CL_116511 · Jun 29 · 17:05

Qwen 3.6 27B 模型被誉为本地人工智能开发的理想选择

Qwen 3.6 27B 模型被重点介绍为本地开发环境的理想选择。其性能和功能使其成为寻求高效有效工具的开发者的有力竞争者。该模型适合本地使用，表明其在强大功能和易用性之间取得了平衡。
MEME · CL_113989 · Jun 27 · 23:42

用户质疑双 RX 9060xt 运行大型语言模型的可行性

一位 r/LocalLLaMA 子版块的用户正在询问使用两块 RX 9060xt 显卡（每块 16GB 显存）运行 Qwen 3.6 27B 等大型语言模型的可行性。用户希望提高编码代理应用程序的生成和预填充速度，因为他们目前 64GB RAM 的笔记本电脑设置只能提供 3-4 tokens/秒的生成速度和 50 tokens/秒的不可用预填充速度。
TOOL · CL_113956 · Jun 27 · 22:07

Qwen 3.6 27B 通过 Pi harness 实现代理式文档脱敏

一位用户成功地在 Pi agent harness 中使用 Qwen 3.6 27B 模型实现了文档脱敏。该设置允许进行上下文感知的脱敏，显著节省了需要文本和图像识别、长上下文理解以及遵守规则的任务时间。用户优化了本地模型设置，包括更高的量化级别以及改进的提示和技能，以获得可接受的结果。已开发一个基于 Gradio 的 UI，方便用户与代理进行交互，该代理使用各种工具和专门技能进行脱敏，并将进度流式传输给用户。
COMMENTARY · CL_111030 · Jun 25 · 20:20

Qwen 3.6 27B 使用 GLM 5.2 架构微调的疑问

一位 Reddit r/LocalLLaMA 社区用户在询问为何缺乏采用 GLM 5.2 架构的 Qwen 3.6 27B 模型微调版本。用户推测这是否由于 GLM 5.2 的近期发布、微调和数据集创建所需的时间，或社区兴趣不足所致。
RESEARCH · CL_107144 · Jun 23 · 18:56

OpenMythos 基准测试发布，凸显 Qwen 3.6 的差异

OpenMythos 模型发布了其基准测试，展示了其在 SWE-bench Pro、CyberGym 和 cybench 上的表现。虽然该模型在其规模和网络安全重点方面表现良好，但仍有进一步改进的空间。此次发布还突显了 Qwen 3.6 27B 在 SWE-bench 结果与官方数据之间存在的差异，这归因于评估工具和问题过滤的差异。
RESEARCH · CL_105984 · Jun 23 · 00:00

OpenAI 发布 GPT-5.5-Cyber，SpaceX 签署 63 亿美元 AI 计算交易，阿里巴巴视频模型排名第二

OpenAI 发布了 GPT-5.5-Cyber，这是一款旨在加强 AI 时代网络安全的新安全插件和合作伙伴计划。另外，SpaceX 与 AI 初创公司 Reflection 达成一项价值高达 63 亿美元的重要交易，以获取其超级计算机 Project Colossus 的使用权，用于训练开源 AI 模型。阿里巴巴的 HappyHorse 1.1 AI 视频模型在全球排名中位列第二，超过了 OpenAI 和 ByteDance 的模型。
TOOL · CL_103502 · Jun 21 · 18:00

Qwen 3.6 27B 模型被修改以降低安全对齐

一个名为 Apostate 的项目发布了一个修改版的 Qwen 3.6 27B 模型，显著降低了其安全对齐。拒绝率从 92% 降至 7.6%，对模型的整体能力影响极小。修改后的模型可在 Hugging Face 上以标准版和 GGUF 版格式提供。

用户发布 140GB GLM-5.2 编码量化版供测试

DFlash 将 llama.cpp 中 Qwen 3.6 27B 的性能提升了 4.44 倍

用户报告称 Qwen 3.6 27B 模型在代理任务中遇到困难

Qwen 3.6 27B 模型通过多令牌预测 (Multi Token Prediction) 将速度提升一倍

Anthropic 发布内部 LLM 工作空间 'J-space'，支持新的可解释性工具 · 跟踪 9 个来源

Qualcomm推出GenieX，可在Windows笔记本上运行LLM

Qwen 3.6 27B VLLM 基准测试显示 NVFP4 在令牌生成方面表现最佳，FP8 在预填充方面表现最佳

HexGrid Cloud 为开放权重模型提供定制化 LLM GPU 基准测试服务

爱好者勾勒本地开源大语言模型的理想未来

SwiReasoning 技术提高了 LLM 的速度和准确性，用户质疑其采用

用户寻求以 5-10 token/秒的速度运行 Qwen 3.6 27B 模型的廉价设置

Deepseek Flash V4 对比 Qwen 3.6 27B：用户寻求性能基准

本地LLM用户寻求关于最大化编码任务上下文窗口的建议

Qwen 3.6 27B 模型被誉为本地人工智能开发的理想选择

用户质疑双 RX 9060xt 运行大型语言模型的可行性

Qwen 3.6 27B 通过 Pi harness 实现代理式文档脱敏

Qwen 3.6 27B 使用 GLM 5.2 架构微调的疑问

OpenMythos 基准测试发布，凸显 Qwen 3.6 的差异

OpenAI 发布 GPT-5.5-Cyber，SpaceX 签署 63 亿美元 AI 计算交易，阿里巴巴视频模型排名第二

Qwen 3.6 27B 模型被修改以降低安全对齐