实体 Qwen 3.5

Qwen 3.5

PulseAugur coverage of Qwen 3.5 — every cluster mentioning Qwen 3.5 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 77

发布 · 30天

90 天内 0

论文 · 30天

90 天内 25

层级分布 · 90 天

frontier release 2
significant 3
research 19
tool 40
commentary 11
meme 2

主题

模型发布 51
产品 38
论文 25
基础设施 21
其他 10
安全 7
融资 1
观点 1

关系

instance of Apache Software License 2.0 90%
used by Nex-N2 Pro 90%
used by Nex AGI 90%
used by Gemma 4 70%
competes with Qwen-3.6 70%
used by vLLM 70%
used by LM Studio 70%
developed by Qwen3.6-27B 70%
developed by Nex-N2 Pro 70%
developed by Ornith 1.0 70%
competes with Qwen3.6 70%
used by Qwen3.6-27B 70%

时间线

2026-06-04 product_launch Alibaba released the Qwen 3.5 model, making its weights publicly available. 来源
2026-05-27 research_milestone Qwen3.5 achieved a record-breaking 580 tps for agentic workloads on the TokenSpeed engine. 来源

情绪 · 30 天

20 天有情绪数据

最近 · 第 1/4 页 · 共 77 条

COMMENTARY · CL_133931 · Jul 9 · 10:00

开放权重的大语言模型（LLM）可免费访问但运行成本高昂，给开发者带来挑战

文章认为，虽然开放权重的LLM在技术上可以免费访问，但其巨大的规模常常使其在标准硬件上运行成本过高且难以实现。Qwen、DeepSeek、GLM、Kimi和MiniMax等模型被列为这一趋势的例子，参数数量达到数百亿甚至数万亿。作者认为，焦点应从原始参数数量和开放权重转移到实际部署成本和效率上，将效率定义为能力与运营成本的最佳比率。对开发者而言，这意味着在本地推理时优先选择更小、更易于管理模型，并在为产品选择模型时，将活跃参数和实际延…
RESEARCH · CL_133110 · Jul 8 · 17:49

Agon 框架使用竞争性 AI 模型对推理进行评分

研究人员推出了一种新颖的竞争性强化学习框架 Agon，旨在提高 AI 模型的推理能力。与仅对最终答案评分的传统方法不同，Agon 将两个模型进行对抗，每个模型通过隐式方式对另一个模型的推理过程进行评分。这种竞争性设置通过面对日益强大的对手，迫使模型发展出更好的思考策略，从而带来显著的性能提升。在 DeepMath 数据集上使用 Qwen3 进行测试时，Agon 的 pass@1 率是标准 GRPO 的两倍，并且比未经训练的 Mixtu…
COMMENTARY · CL_131880 · Jul 8 · 08:55

AI 自进化可能始于外部系统，而非模型权重

前 OpenAI 安全副总裁 Wonyong Li 提出了一条 AI 自进化的新路径，建议从外部操作系统（Harness）开始，而不是直接修改模型权重。该 Harness 系统负责管理工具使用、上下文、任务拆分和结果验证，并可根据观察到的失败进行迭代改进。DeepSeek 的崔天言等研究人员认为，改进 Harness 是 AI 进步的一个有前景的方向，有可能在不改变核心模型的情况下实现显著的性能提升。
TOOL · CL_131941 · Jul 8 · 06:06

Horus Hiero AI 模型发布，用于古埃及象形文字翻译

一款名为 Horus Hiero 的开源 AI 模型已发布，专门用于翻译古埃及象形文字。Horus Hiero 基于 Qwen 3.5 构建，提供 9B 和 4B 参数版本，支持约 150 种语言。它具备多模态能力，包括文本、图像和视频理解，并拥有高达 100 万个 token 的大上下文窗口。
TOOL · CL_126183 · Jul 5 · 12:03

未审查的Qwen 3.5微调版发布，用于网络安全和研究

Qwen 3.5模型的一个未审查版本MaralGPT Mythos 9B已发布。该模型拥有九十亿参数，在来自GPT 5.5和Claude 4.8 Opus等先进模型的超过5亿个token的合成数据上进行了微调，并使用Heretic LLM库移除了伦理限制。它专为网络安全、生物学和化学领域的应用而设计，能够无审查地回答任何查询。
COMMENTARY · CL_126117 · Jul 5 · 10:41

欧洲AI平台Eustella因模型安全性和透明度问题面临审查

Eustella，一个将自己定位为Gemini和ChatGPT安全替代品的欧洲AI平台，因其安全性和透明度问题引发了质疑。该平台使用了来自Google (Gemma 4)、阿里巴巴集团 (Qwen 3.5/3.7)、OpenAI (gpt-oss-120b) 和 Mistral AI 的模型。尽管提供了本地部署选项，但人们对这些开放权重模型的可靠性表示担忧，批评者认为它们在运行和训练数据方面缺乏真正的透明度。
TOOL · CL_125789 · Jul 5 · 03:02

开源模型助力企业AI实现PDF到JSON的转换

新的开源模型正在涌现，用于将PDF中的非结构化数据转换为可用的JSON格式，满足企业AI应用的关键需求。这些模型主要分为两类：针对发票和表单等已知字段的模式驱动提取，以及能够将整个页面（包括布局和表格）重构为结构化JSON或Markdown的文档解析。Datalab的lift和NuMind的NuExtract 3等模型提供了本地、经济高效的模式驱动提取解决方案，而IBM的Docling则为各种文件类型提供了全面的文档解析功能。
TOOL · CL_125026 · Jul 4 · 09:58

Qwen3.5 模型量化用于 ComfyUI，可在 8GB 显存上运行

一位用户发布了 Qwen3.5 模型（2B、4B 和 9B 参数）的量化版本，供 ComfyUI 使用。这些采用 ConvRot 量化的 INT8 模型设计用于在仅需 8GB 显存的系统上高效运行。该用户提供了现有 BF16 模型的直接替换方案，并包含用于 LoRA 训练的图像提示、分析和字幕生成的工作流。
TOOL · CL_120377 · Jul 1 · 15:00

Qwen 3.5 和 Ornith 1.0 模型作为代码代理失败

对 Qwen 3.5 9B 和 Ornith 1.0 9B 模型的比较显示，即使在标准硬件上，两者都未准备好用作代码代理。两个模型都未能通过最简单的代理任务级别，原生工具调用 API 的表现不如简单的提示。虽然两个模型都表现出危险的故障模式，例如幻觉式地完成任务或在更难的任务中进入无限循环，但 Qwen 3.5 9B 更容易输出散文而不是工具调用，而 Ornith 1.0 9B 更频繁地出现幻觉式完成。
RESEARCH · CL_116868 · Jun 30 · 00:25

OpenAI 发布定制芯片；Shopify 构建模型无关型堆栈；Gemini 图像生成功能免费

OpenAI 与 Broadcom 合作开发了其首款代号为 Jalapeño 的定制芯片，专门用于 LLM 推理。此举旨在减少对 Nvidia 硬件的依赖，并可能提供更快的响应速度和更低的成本，计划于 2026 年开始大规模部署数据中心。与此同时，Shopify 创建了一个模型无关的 AI 基础设施，允许工程师在不同的 LLM 提供商之间无缝切换，并采用蒸馏管道从前沿模型创建成本更低、速度更快的学生模型。另外，Google 已将其个性…
RESEARCH · CL_115129 · Jun 29 · 01:00

开源AI中Transformer注意力机制的演进

自诞生以来，Transformer架构的注意力机制经历了显著的演进，众多创新为更高效、更强大的大型语言模型做出了贡献。FlashAttention、多查询注意力（MQA）、分组查询注意力（GQA）和滑动窗口注意力（SWA）等创新极大地降低了内存需求并提高了推理性能。最新的进展，包括门控Delta网络（GDNs）等线性注意力变体和原生稀疏注意力（DSA）等稀疏注意力方法，正在进一步拓展边界，许多开源模型都采用了这些技术。
TOOL · CL_113872 · Jun 27 · 10:08

Orthrus 将发布带有开源代码的 Qwen 3.5/3.6 和 Gemma 4 模型

Orthrus 是一个专注于训练大型语言模型的项目，它正准备发布对 Qwen 3.5、Qwen 3.6 和 Gemma 4 模型以及相关代码的支持。除了模型检查点，Orthrus 还将开源其完整的训练和评估代码。此次发布迫在眉睫，其代码库预计将很快更新。
COMMENTARY · CL_111410 · Jun 26 · 01:12

OpenAI内部AI使用量激增；新开源模型和代理功能涌现

OpenAI报告称，自2025年11月以来，其内部AI模型使用量在各部门显著增加，Codex的平均输出令牌在研究部门增长了高达56倍。这种令牌消耗的激增，尤其是在编码任务之外，凸显了AI工具在公司运营中的日益深入的整合。与此同时，开源AI领域也取得了进展，GLM-5.2在编码和代理基准测试中表现强劲，并且出现了Ornith-1.0等新的专业模型。Google还增强了其Gemini 3.5 Flash模型，使其具备内置的计算机使用能力，…
SIGNIFICANT · CL_110786 · Jun 25 · 17:11

DeepReinforce 发布 Ornith-1.0 开源编码模型，可学习 RL 脚手架

DeepReinforce 推出了 Ornith-1.0，这是一个在 MIT 许可下提供的开源编码模型家族。这些模型基于 Gemma 4 和 Qwen 3.5 构建，专为代理编码任务设计，并在训练过程中独特地学习自身的强化学习脚手架。最大的模型 Ornith-1.0-397B 在 SWE-Bench Verified 基准测试中取得了 82.4% 的优异成绩。
TOOL · CL_108814 · Jun 24 · 12:31

Qwen3.5 提升了 AMD 硬件上的 vLLM 性能

本文详细介绍了如何在 Lemonade 服务器上的 AMD 硬件上优化 vLLM 推理引擎。作者分享了他们修复问题的经验，并在使用 Qwen3.5 模型时实现了三倍的批处理吞吐量。该指南旨在帮助用户克服常见问题，并提高 AMD 系统上的性能。
RESEARCH · CL_107144 · Jun 23 · 18:56

OpenMythos 基准测试发布，凸显 Qwen 3.6 的差异

OpenMythos 模型发布了其基准测试，展示了其在 SWE-bench Pro、CyberGym 和 cybench 上的表现。虽然该模型在其规模和网络安全重点方面表现良好，但仍有进一步改进的空间。此次发布还突显了 Qwen 3.6 27B 在 SWE-bench 结果与官方数据之间存在的差异，这归因于评估工具和问题过滤的差异。
COMMENTARY · CL_105455 · Jun 23 · 05:53

Reddit上关于Qwen 3.5 Agent训练方法的讨论

一位Reddit用户正在寻求关于训练Qwen 3.5模型用于多工具Agent使用的建议。他们想知道是先进行监督微调（SFT）再进行强化学习（RL），还是直接采用纯RL方法。该用户还询问了用于工具使用Agent的有效奖励函数设计，以及处理并行工具执行的策略，特别是当一个工具的输出需要多次后续工具调用时。
TOOL · CL_104041 · Jun 22 · 15:26

Qwen3.5-MoE微调NEX-N2-mini在低token使用量下展现出强大的推理能力

一个Qwen3.5-MoE模型的微调版本NEX-N2-mini已发布，并展现出有希望的结果。早期测试表明，它提供的推理能力可与Qwen3.5和Qwen3.6等模型媲美甚至更优，但token使用量显著减少。这种效率可能使其成为本地运行模型的用户的宝贵选择，尤其是在Mac等设备上。
TOOL · CL_134643 · Jun 22 · 06:34

Gepard-1.0：发布实时对话式语音合成模型，支持语音克隆

nineninesix/gepard-1.0 模型是一个新的自回归文本转语音系统，专为实时对话应用而设计。它能在文本到达时流式输出音频，与传统模型相比，提供了更自然、更即时的语音体验。Gepard 通过单次处理音频来实现这一点，并且能够从短音频片段进行语音克隆。
MEME · CL_106390 · Jun 21 · 11:44

用户探索OpenCode和Qwen 3.5组合的能力

用户正在探索他们包含“openCode”和“Qwen 3.5”的组合的能力。他们正在记录他们的经验，以了解这种配置的优点和局限性。

开放权重的大语言模型（LLM）可免费访问但运行成本高昂，给开发者带来挑战

Agon 框架使用竞争性 AI 模型对推理进行评分

AI 自进化可能始于外部系统，而非模型权重

Horus Hiero AI 模型发布，用于古埃及象形文字翻译

未审查的Qwen 3.5微调版发布，用于网络安全和研究

欧洲AI平台Eustella因模型安全性和透明度问题面临审查

开源模型助力企业AI实现PDF到JSON的转换

Qwen3.5 模型量化用于 ComfyUI，可在 8GB 显存上运行

Qwen 3.5 和 Ornith 1.0 模型作为代码代理失败

OpenAI 发布定制芯片；Shopify 构建模型无关型堆栈；Gemini 图像生成功能免费

开源AI中Transformer注意力机制的演进

Orthrus 将发布带有开源代码的 Qwen 3.5/3.6 和 Gemma 4 模型

OpenAI内部AI使用量激增；新开源模型和代理功能涌现

DeepReinforce 发布 Ornith-1.0 开源编码模型，可学习 RL 脚手架

Qwen3.5 提升了 AMD 硬件上的 vLLM 性能

OpenMythos 基准测试发布，凸显 Qwen 3.6 的差异

Reddit上关于Qwen 3.5 Agent训练方法的讨论

Qwen3.5-MoE微调NEX-N2-mini在低token使用量下展现出强大的推理能力

Gepard-1.0：发布实时对话式语音合成模型，支持语音克隆

用户探索OpenCode和Qwen 3.5组合的能力