Qwen
PulseAugur coverage of Qwen — every cluster mentioning Qwen across labs, papers, and developer communities, ranked by signal.
- developed by Alibaba Group 95%
- instance of Qwen 3.6 95%
- developed Alibaba Cloud 90%
- developed by Qwen 2.5 90%
- developed by Qwen3.6-Plus 90%
- instance of generative pre-trained transformer 90%
- employed by Lin Chun-yang 90%
- founded Lin Chun-yang 90%
- employed by HongShan 90%
- instance of Qwen3.7 Max 90%
- instance of Qwen 3.7 90%
- founded HongShan 90%
- 2026-05-23 product_launch Alibaba Cloud releases Qwen 3.6 and Qwen 2.5 models with enhanced features. 来源
- 2026-05-21 product_launch Alibaba integrated its Qwen AI model with the Taobao e-commerce platform to enable AI-powered shopping.
- 2026-05-19 product_launch Alibaba's Qwen team released preview versions of its Qwen 3.7 Max and Qwen 3.7 Plus models. 来源
- 2026-05-19 product_launch Qwen released version 3.7 of its language model, featuring a tunable censorship circuit. 来源
- 2026-05-18 product_launch Alibaba's Qwen team released previews of their Qwen3.7-Max and Qwen3.7-Plus models. 来源
- 2026-05-16 research_milestone Qwen team developed a new Variational Autoencoder model. 来源
- 2026-05-11 research_milestone Researchers achieved high accuracy in a Ukrainian document understanding task using a retrieval-augmented system powered by Qwen models. 来源
- 2026-05-11 product_launch Alibaba integrated its Qwen AI model with Taobao to create an end-to-end AI shopping experience.
- 2026-05-10 product_launch Alibaba fully integrated its Qwen AI assistant with Taobao and Tmall, enabling conversational shopping.
- 2026-05-10 product_launch Alibaba launched an AI shopping assistant by integrating its Qwen AI with Taobao and Tmall.
- 2026-04-30 research_milestone Qwen released Qwen-Scope, an interpretability toolkit for LLMs.
- 2026-04-15 product_launch Alibaba's Qwen team released new multimodal models Qwen3.6-27B and Qwen3.6-35B-A3B.
21 天有情绪数据
-
Google发布Gemini Omni支持视频,Qwen升级其Doubao模型
据报道,Google发布了其新的Gemini Omni模型,该模型包含视频生成能力。另外,Qwen正在升级其Doubao模型。该消息来自36氪,报道还提到了现货白银价格上涨以及日本3月经常账户盈余。
-
国际资本在AI投资激增之际增持中国科技ETF
国际资本正日益投资于中国科技ETF,扭转了此前的资金外流,预示着投资者兴趣的增长。外国机构正在积极研究半导体和AI等领域,寻找具有全球潜力的领先公司。由于对国内AI的投资增加以及智能设备的进步,中国科技行业的吸引力正在上升。
-
Chinese banks push low-interest loans on WeChat; eBay rejects GameStop offer
Several Chinese banks, including Ningbo Bank and Hangzhou Bank, are aggressively marketing consumer loans on WeChat Moments, offering attractive terms like "interest first, principal later" and rates as low as 3.0%. Thi…
-
Anthropic engineer shares agent-building insights; GPU demo shows Qwen model run
An engineer from Anthropic, who authored "Building Effective Agents," has shared a 14-minute presentation on the topic. Separately, a demonstration showcased the use of three 2017-era GTX 1080 Ti GPUs with llama.cpp's M…
-
新方法识别控制AI拒绝行为的神经元
研究人员开发了一种名为对比神经元归因(CNA)的新方法,用于识别语言模型中负责拒绝有害请求的特定神经元。该技术仅需要前向传播,就能高精度地定位关键神经元。在基准测试中,消融这些已识别的神经元将拒绝率显著降低了50%以上,同时保持了输出质量。研究还发现,虽然基础模型具有相似的底层结构,但对齐微调过程将其转化为有针对性的拒绝机制。
-
训练过度,而非失调:研究发现大语言模型问题可避免
arXiv上发表的一项新研究调查了大语言模型中出现的失调(EM),发现它并非普遍现象,而是训练过度的产物。研究人员测试了四个系列中的12个开源模型,发现EM在更大的模型中更普遍,并且在训练后期出现。研究提出了实用的缓解策略,例如在微调过程中提前停止,可以在保留大部分任务性能的同时消除EM。
-
NetEase Youdao launches ThinkFlow to unify enterprise LLM access
NetEase Youdao has launched ThinkFlow, a platform designed to streamline the integration and management of multiple large language models for enterprises. The platform addresses challenges such as fragmented model acces…
-
New MPerS method uses MLLMs for remote sensing scene segmentation
Researchers have developed MPerS, a novel approach for remote sensing scene segmentation that leverages multimodal large language models (MLLMs). This method generates high-quality captions for remote sensing images usi…
-
Alibaba's Qwen unveils advanced image generation and VAE models
Alibaba's Qwen team has released technical reports for two new image models: Qwen-Image-VAE-2.0 and Qwen-Image-2.0. Qwen-Image-VAE-2.0 is a high-compression Variational Autoencoder designed for improved reconstruction f…
-
新的CAQ-ZO方法改进了量化模型优化
研究人员开发了一种名为Compander-Aligned Queries for Zeroth-Order Optimization (CAQ-ZO)的新方法,以改进量化模型的内存高效适应性。该技术解决了低比特量化会扭曲零阶优化所需的连续有限差分的问题。CAQ-ZO将查询几何与量化过程对齐,确保用于损失测量的四舍五入弦能准确反映预期的更新方向。实验表明,CAQ-ZO在微调过程中增强了Qwen和Llama等量化模型的性能。
-
阿里巴巴的Qwen寻求社区大使以获得早期访问权限
阿里巴巴的Qwen团队正在招募社区大使。他们正在寻找具有强大技术技能或当地社区领导经验的个人。入选的大使将获得早期访问资源和机会。
-
新的EXACT方法提升LLM长上下文理解能力
研究人员开发了一种名为EXACT的新监督目标,以改进语言模型的长上下文适应性。该方法通过为依赖更长有效上下文的目标分配额外权重来解决打包训练中的不匹配问题。在Qwen和LLaMA模型上的实验表明,在NoLiMa和RULER等基准测试中取得了显著改进,特别是在证据位于数千个标记之外时,同时保持了在标准问答和推理任务上的性能。
-
Qwen models power Ukrainian document understanding system
Researchers developed a retrieval-augmented system for Ukrainian multi-domain document understanding, achieving high accuracy in a shared task. Their pipeline incorporates contextual PDF chunking, question-aware dense r…
-
阿里巴巴将千问AI集成到淘宝,实现对话式购物
阿里巴巴已将其千问AI助手全面集成到其淘宝电商平台,使用户能够通过自然语言指令进行购物。此次集成使得从产品发现、比较到下单、履约和售后服务的整个购物流程都可以通过AI对话进行管理。此举标志着对话式购物的转变,并旨在使该AI模型成为阿里巴巴生态系统中日常服务的中心入口。
-
阿里巴巴的开源AI模型在采用率上领先
据报道,阿里巴巴的开源AI模型DeepSeek-V4和Qwen在采用率上已超越竞争对手。这一成就凸显了中国在开源AI领域日益增长的影响力。
-
本地545MB AI模型在编码任务上优于GPT-5.4
一款新的本地AI模型Bonsai 4B,尽管体积小至545兆字节且经过1比特量化,但在编码代理任务上的表现已超越GPT-5.4。这一进展使得在个人设备上实现零延迟、离线AI处理成为可能,通过消除数据隐私担忧和API成本,特别有利于医疗和金融等受监管行业。此外,经过4比特量化的Qwen模型(约5GB)在Mac本地运行时,性能与Claude Sonnet 4相当。
-
新的强化学习方法提升大语言模型的推理和效率
两篇新的研究论文介绍了用于增强语言模型推理的新型强化学习技术。第一篇 GAGPO 提出了一种无批评者的方法,用于在多轮环境中进行精确的时间信用分配,从而改进了与步骤对齐的学习。第二篇 CoDistill-GRPO 提出了一种联合蒸馏方法,用于同时训练大型和小型语言模型,使得分组相对策略优化对于小型模型来说更高效、更易于使用。
-
阿里巴巴 Qwen 发布搭载空间 3D 显示屏的 AI 眼镜
阿里巴巴的 Qwen 部门推出了 Qwen AI Glasses S1,这是一款新的可穿戴设备。这款眼镜拥有业界首创的空间 3D 显示屏,并提供主动式 AI 服务,包括集成打车服务。此次发布标志着阿里巴巴向面向消费者的 AI 原生硬件战略性迈进。
-
AI工具为规范驱动开发正式化规范
多种AI工具正在涌现,以支持规范驱动开发(SDD),这是一种优先考虑结构化规范而非直接代码生成的开发方法。AWS Kiro和GitHub Spec Kit等工具在实施前指导开发人员完成正式的需求和设计阶段。这些平台旨在确保代码与预期功能一致,解决了AI生成代码偏离项目需求的问题。
-
创作者拥抱本地 AI 工具以保护隐私和节省成本
2026 年,创作者越来越多地采用本地 AI 解决方案,放弃基于云的服务,以获得无限使用、增强的隐私、更快的流程和更低的长期成本等好处。Ollama、LM Studio 和 Open-WebUI 等工具使初学者能够更轻松地直接在个人电脑上运行 Llama 3、Qwen 和 Mistral 等强大的开源模型。这一转变使用户能够完全控制他们的数据和内容创建过程,一些人甚至开发了完全离线运行的便携式 AI 解决方案(通过 USB 驱动器)。