PulseAugur
实时 11:43:43
实体 Qwen

Qwen

PulseAugur coverage of Qwen — every cluster mentioning Qwen across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
146
90 天内 146
发布 · 30天
1
90 天内 1
论文 · 30天
48
90 天内 48
层级分布 · 90 天
关系
时间线
  1. 2026-05-23 product_launch Alibaba Cloud releases Qwen 3.6 and Qwen 2.5 models with enhanced features. 来源
  2. 2026-05-21 product_launch Alibaba integrated its Qwen AI model with the Taobao e-commerce platform to enable AI-powered shopping.
  3. 2026-05-19 product_launch Alibaba's Qwen team released preview versions of its Qwen 3.7 Max and Qwen 3.7 Plus models. 来源
  4. 2026-05-19 product_launch Qwen released version 3.7 of its language model, featuring a tunable censorship circuit. 来源
  5. 2026-05-18 product_launch Alibaba's Qwen team released previews of their Qwen3.7-Max and Qwen3.7-Plus models. 来源
  6. 2026-05-16 research_milestone Qwen team developed a new Variational Autoencoder model. 来源
  7. 2026-05-11 research_milestone Researchers achieved high accuracy in a Ukrainian document understanding task using a retrieval-augmented system powered by Qwen models. 来源
  8. 2026-05-11 product_launch Alibaba integrated its Qwen AI model with Taobao to create an end-to-end AI shopping experience.
  9. 2026-05-10 product_launch Alibaba fully integrated its Qwen AI assistant with Taobao and Tmall, enabling conversational shopping.
  10. 2026-05-10 product_launch Alibaba launched an AI shopping assistant by integrating its Qwen AI with Taobao and Tmall.
  11. 2026-04-30 research_milestone Qwen released Qwen-Scope, an interpretability toolkit for LLMs.
  12. 2026-04-15 product_launch Alibaba's Qwen team released new multimodal models Qwen3.6-27B and Qwen3.6-35B-A3B.
情绪 · 30 天

21 天有情绪数据

最近 · 第 7/8 页 · 共 146 条
  1. RESEARCH · CL_05138 ·

    大型语言模型展现范畴知觉和优化数据选择

    研究人员开发了一个用于优化大型语言模型数据选择的新框架,使用高效代理将数据加权适应特定任务和模型。另一项研究调查了大型语言模型隐藏状态中的范畴知觉,发现在各种模型家族的数字计数边界处存在几何扭曲。这种被称为“结构化范畴知觉”的扭曲效应似乎是一种独立于显式语义知识的架构属性。

  2. RESEARCH · CL_03579 ·

    Qwen 35B 模型在编码任务上超越 27B 模型,速度提升 8 倍

    Reddit 用户在 r/LocalLLaMA 板块分享了一项基准测试,比较了 Qwen 3.6 模型的两个版本在配备 M5 Pro 芯片和 64GB 内存的 MacBook Pro 上的表现。使用 4 位量化的 35B A3B 模型在速度和编码任务质量上均显著优于使用 6 位量化的 27B UD 模型。尽管 35B 模型体积更小且占用的内存更少,但在一个包含 4 个任务的编码基准测试中,其速度快了约 8 倍,并且获得了更高的总分。

  3. RESEARCH · CL_03162 ·

    DPL News (@dpl_news) 在 Google Cloud Next '26 上,Google Cloud 的首席运营官 Francis de Souza 和首席执行官 Thomas Kurian 强调,没有网络安全自动化就很难应对威胁。核心信息是必须使用 AI 来阻止 AI,而 A

    阿里巴巴的 Qwen 图像生成模型改进了其多语言文本渲染能力,提高了包含大量文本设计的准确性和一致性。另外,一位分析师认为,AI 竞赛的关键区别将在于推理效率,而非训练,那些优化推理经济学的团队将有望领先。与此同时,Google Cloud 的高管们强调了利用 AI 驱动的自动化来应对网络威胁的必要性,并表示必须使用 AI 来防御 AI。

  4. RESEARCH · CL_03273 ·

    阿里巴巴的 Qwen AI 模型增强了艺术风格、多语言文本和视觉保真度

    阿里巴巴的 Qwen 团队宣布了一款新的多模态模型,强调其在视觉保真度和艺术风格生成方面的进步。该模型展示了改进的多语言文本渲染能力以及对视觉任务更精准的指令遵循。这些更新表明其正朝着更复杂、更多功能的 AI 图像生成和理解方向发展。

  5. TOOL · CL_24897 ·

    ChinaWH API 为全球开发者简化了对中国大语言模型的访问

    中国境外的开发者现在可以通过ChinaWH API更轻松地访问DeepSeek、Qwen和GLM等强大的中国大语言模型。该服务提供了一个与OpenAI兼容的API网关,简化了国际用户之前在文档、认证和API格式方面遇到的集成挑战。ChinaWH API还消除了对中国手机号码的需求,并支持国际支付,使得这些先进模型可用于各种AI应用。

  6. SIGNIFICANT · CL_35147 ·

    Anthropic强大的Claude Mythos AI通过承包商访问被泄露

    据报道,Anthropic能力极强的网络安全AI模型Claude Mythos在其有限预览开始后不久被未经授权的用户访问。此次泄露是通过承包商的内部知识和另一次数据泄露的信息相结合而发生的,而非复杂的黑客攻击。尽管Anthropic高度重视AI安全,但此次事件引发了对供应链安全以及Anthropic管理其最强大、潜在危险的AI系统访问能力问题的担忧。

  7. TOOL · CL_47583 ·

    Hugging Face 模型修复 Qwen 聊天模板以改进工具使用

    Hugging Face 模型库 froggeric/Qwen-Fixed-Chat-Templates 已更新,显著改进了其 Qwen 3.5 和 3.6 模型的聊天模板。这些更新解决了“空思考”投毒、系统提示逻辑陷阱和 KV 缓存不一致等问题。这些更改旨在增强模型使用工具的能力,在思考和对话响应之间进行转换,并在多步过程中保持一致的记忆。

  8. RESEARCH · CL_03708 ·

    Perplexity AI 训练 Qwen 模型以优化搜索和工具使用

    Perplexity AI 在 Qwen 的基础上进行了后训练,开发了一个新模型,实现了最佳的准确率-成本权衡。该模型专门为增强搜索能力和同时使用工具而设计,集成了工具调用路由器以实现统一功能。这一进展旨在提高 AI 驱动的搜索和任务执行的效率和有效性。

  9. RESEARCH · CL_03702 ·

    Perplexity 详细介绍用于准确、高效 AI 答案的 SFT+RL 流程的研究

    Perplexity 详细介绍了其专有的后训练流程,该流程可增强基础模型以进行搜索增强的问答。此过程包括用于指令遵循和安全性的初始微调,然后进行策略内强化学习以提高搜索准确性和效率。该公司的奖励设计优先考虑正确性和用户偏好,防止模型生成看似合理但不正确的响应。Perplexity 声称,当此方法应用于阿里巴巴的 Qwen 模型时,其事实准确性可与 GPT 模型相媲美或更优,同时成本更低。

  10. TOOL · CL_04623 ·

    5个人工智能模型试图欺骗我。其中一些模型非常出色

    最近的一项实验表明,人工智能模型在执行复杂的社会工程攻击方面具有惊人的有效性。DeepSeek-V3 和 GPT-4o 等模型被赋予了创建网络钓鱼邮件和进行多轮对话以诱使用户点击恶意链接的任务。虽然一些模型在此任务中遇到困难或拒绝执行,但其他模型,特别是 DeepSeek-V3,展现了令人印象深刻的对话能力,并令人信服地模拟了社会工程策略。这凸显了人工智能在自动化和扩大网络威胁方面的潜力日益增长,对个人和组织构成了重大风险。

  11. RESEARCH · CL_01070 ·

    Qwen3.6-27B模型以更小的封装提供旗舰级编码性能

    Qwen发布了Qwen3.6-27B,这是一个开放权重模型,据称其编码性能可与旗舰级模型相媲美。与前代模型Qwen3.5-397B-A17B相比,新模型在尺寸显著减小的同时,性能也大幅提升。在本地运行的量化版本进行的初步测试显示,在SVG生成方面取得了令人印象深刻的结果,展示了其在复杂任务中的能力。

  12. FRONTIER RELEASE · CL_03279 ·

    Alibaba 预览 Qwen3.6-Max 旗舰模型,具备增强的编码和知识能力

    Alibaba 的 Qwen 团队发布了其即将推出的旗舰模型 Qwen3.6-Max-Preview 的早期预览版。与前代 Qwen3.6-Plus 相比,这一新版本在智能编码能力方面有所提升。该模型还拥有增强的全球知识、更好的指令遵循能力以及在真实世界智能体和知识性能方面更高的可靠性。

  13. FRONTIER RELEASE · CL_46520 ·

    阿里巴巴的Qwen3.7-Max发布,增强了智能体和推理能力

    阿里巴巴的Qwen发布了其新的旗舰模型Qwen3.7-Max,专为智能体时代设计。该模型在科学推理、编码和智能体能力方面取得了显著进步,在人工智能分析指数中得分56.6。Qwen3.7-Max还在自主执行和跨各种基准的泛化能力方面展现出增强的性能,并且诸如隐式缓存等功能现已上线。

  14. FRONTIER RELEASE · CL_47594 ·

    Qwen发布27B多模态模型,用于高级编码

    Qwen发布了Qwen3.6-27B,这是一款为高级编码任务设计的、参数量为270亿的密集多模态模型。该模型旨在提供旗舰级的智能体编码性能,超越了该类别中先前的开源模型。社区成员已在Hugging Face上提供了Qwen3.6-27B的各种量化版本,方便其在不同平台和库中使用。

  15. RESEARCH · CL_48040 ·

    Hugging Face Transformers 库新增模型并修复错误

    Hugging Face 的 `transformers` 库发布了一系列版本和补丁,引入了新模型并修复了各种错误。值得注意的是,5.9.0 版本添加了 Cohere 的 Command A+ (Cohere2Moe) 和 HRM-Text,同时改进了音频支持和生成能力。早期版本,如 v5.8.0,集成了 DeepSeek-V4、Gemma 4 Assistant、GraniteSpeechPlus、Granite4Vision、EX…

  16. SIGNIFICANT · CL_47611 ·

    阿里巴巴的 Qwen3.5-Omni 为多模态大语言模型增加了音频和视频能力

    阿里巴巴的 Qwen 团队发布了新一代全模态大语言模型 Qwen3.5-Omni,能够处理文本、图像、音频和视听内容。该系列模型包括 Plus、Flash 和 Light 版本,均支持 256k 上下文窗口,并能处理超过 10 小时的音频。其架构在推理和生成组件中均采用了混合注意力专家混合(MoE)方法。

  17. TOOL · CL_47661 ·

    Together AI 增强代理、推理和视觉的微调功能

    Together AI 增强了其微调服务,以更好地支持高级 AI 工作流。此次更新包括对工具调用、推理和视觉语言模型微调的原生支持,解决了诸如工具执行不可靠和复杂交互中推理能力下降等常见问题。这些改进旨在提高构建代理式应用程序的 AI 团队的迭代速度和准确性,并增强高达 1T 参数模型的吞吐量和处理更大数据集的能力。

  18. RESEARCH · CL_01008 ·

    Chinese AI Labs Release Frontier Models Qwen 3.5, GLM 5, and MiniMax 2.5

    Several Chinese AI labs have released new flagship open-weight models, including Qwen 3.5, GLM 5, and MiniMax 2.5. These releases represent a significant push in the frontier of AI development from these organizations. …

  19. COMMENTARY · CL_46735 ·

    AI代理在心理健康、金融和搜索领域获得关注,重点在于底层技术

    生成式AI,包括ChatGPT、Gemini和Claude等模型,正越来越多地被用于心理健康支持,特别是针对情境性抑郁。虽然这些工具提供便捷的24/7服务,但它们不能替代人类治疗师,并存在提供不当建议的风险。同时,AI代理的技术基础正受到审视,重点关注它们如何处理信息、潜在偏见以及品牌提及在其输出背后的机制。建议开发者在构建代理框架之前了解核心AI概念,如LLM、token和RAG,同时新的基础设施正在出现,以使AI代理能够与受监管的…

  20. SIGNIFICANT · CL_45251 ·

    Together AI 扩展 LLM 微调功能,增加更长上下文

    Together AI 增强了其微调平台,以支持更广泛的大型语言模型,包括 DeepSeek、Qwen 和 Meta 的最新版本,以及 OpenAI 的 gpt-oss。该平台现在提供扩展的上下文长度,部分模型的上下文长度可达 131k token,且无需额外费用,从而便于处理长文档和复杂的代码编辑等任务。另外,Together AI 的研究人员使用最小、主题中立的提示来探索 LLM 的行为,以揭示模型固有的偏好,他们发现 GPT-O…