PulseAugur
实时 10:12:57
实体 Qwen

Qwen

PulseAugur coverage of Qwen — every cluster mentioning Qwen across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
146
90 天内 146
发布 · 30天
1
90 天内 1
论文 · 30天
48
90 天内 48
层级分布 · 90 天
关系
时间线
  1. 2026-05-23 product_launch Alibaba Cloud releases Qwen 3.6 and Qwen 2.5 models with enhanced features. 来源
  2. 2026-05-21 product_launch Alibaba integrated its Qwen AI model with the Taobao e-commerce platform to enable AI-powered shopping.
  3. 2026-05-19 product_launch Alibaba's Qwen team released preview versions of its Qwen 3.7 Max and Qwen 3.7 Plus models. 来源
  4. 2026-05-19 product_launch Qwen released version 3.7 of its language model, featuring a tunable censorship circuit. 来源
  5. 2026-05-18 product_launch Alibaba's Qwen team released previews of their Qwen3.7-Max and Qwen3.7-Plus models. 来源
  6. 2026-05-16 research_milestone Qwen team developed a new Variational Autoencoder model. 来源
  7. 2026-05-11 research_milestone Researchers achieved high accuracy in a Ukrainian document understanding task using a retrieval-augmented system powered by Qwen models. 来源
  8. 2026-05-11 product_launch Alibaba integrated its Qwen AI model with Taobao to create an end-to-end AI shopping experience.
  9. 2026-05-10 product_launch Alibaba fully integrated its Qwen AI assistant with Taobao and Tmall, enabling conversational shopping.
  10. 2026-05-10 product_launch Alibaba launched an AI shopping assistant by integrating its Qwen AI with Taobao and Tmall.
  11. 2026-04-30 research_milestone Qwen released Qwen-Scope, an interpretability toolkit for LLMs.
  12. 2026-04-15 product_launch Alibaba's Qwen team released new multimodal models Qwen3.6-27B and Qwen3.6-35B-A3B.
情绪 · 30 天

21 天有情绪数据

最近 · 第 6/8 页 · 共 146 条
  1. RESEARCH · CL_15728 ·

    尽管多模态推理取得进展,MLLM仍显示出基础性的视觉差距

    一篇新论文介绍了一种通过在推理时优化视觉潜在表征来改善多模态大型语言模型(MLLM)潜在推理的方法,解决了其贡献被抑制的病理现象。另外一项研究使用一个名为VisFactor的新基准,揭示了当前MLLM(包括GPT和Gemini等前沿模型)存在显著的基础性视觉差距。该基准基于人类认知心理学评估,突出了在空间关系推理和图形-背景分离等任务中的持续性失败,表明当前MLLM的表现可能无法反映真实的视觉认知。

  2. RESEARCH · CL_16112 ·

    新的SFT方法将强化学习与玻尔兹曼投影对齐

    研究人员开发了一种名为参考采样玻尔兹曼投影(BOLT)的新方法,用于改进具有可验证奖励的强化学习。该技术旨在通过在预计算数据上使用静态监督微调(SFT)来将rollout生成与优化过程解耦。BOLT过程建立了一个目标匹配的加权SFT目标,该目标被证明等同于KL正则化的RLVR优化器。

  3. TOOL · CL_13341 ·

    精心策划的学习路径指导开发者构建实时语音AI代理

    一个名为“面向初学者的语音AI”的新GitHub存储库,为开发者提供了一个构建实时语音AI代理的结构化学习路径。该指南涵盖了从初始语音到文本调用到扩展生产电话的整个过程。它详细介绍了现代语音AI堆栈,包括实时传输、流式管道和轮流模型,并将资源按难度级别进行分类。

  4. SIGNIFICANT · CL_10806 ·

    House panels investigate Airbnb, Cursor over Chinese AI use

    Two US House committees are investigating Airbnb and Cursor for their alleged use of Chinese artificial intelligence models. The probes are focused on whether these companies are employing AI developed in China, specifi…

  5. RESEARCH · CL_13428 ·

    IBM 发布 Granite 4.1 AI 模型系列,面向企业工作负载

    IBM 推出了其 Granite 4.1 系列 AI 模型,这是其迄今为止规模最大的发布。这一新系列包括语言、视觉、语音、嵌入和 Guardian 模型,专为企业应用设计。这些模型旨在提高指令遵循、工具调用和转录准确性等方面的性能,并注重训练过程中的数据质量和分阶段优化。

  6. RESEARCH · CL_11541 ·

    New MEDS dataset maps LLM math reasoning, bias, and attitudes

    Researchers have introduced MEDS (Math Education Digital Shadows), a new dataset designed to evaluate how large language models perform in mathematics and identify potential biases. MEDS comprises 28,000 personas across…

  7. RESEARCH · CL_10429 ·

    Alibaba Cloud leads AI agent security with top scores in IDC threat detection report

    Alibaba Cloud has been recognized by IDC for its leadership in AI agent security, receiving the highest overall score and the most perfect scores in a recent evaluation. The company's Agent Security Center achieved full…

  8. RESEARCH · CL_11458 ·

    新的诊断工具探查LLM的电路,以获得安全性和行为见解

    一篇新的研究论文介绍了一种名为“扰动探测”(Perturbation Probing)的诊断方法,用于理解大型语言模型(LLMs)的内部工作机制。该技术使用每个提示(prompt)进行两次前向传播(forward passes)来识别和分析模型前馈网络(FFNs)中的“行为电路”。研究发现了两种主要的电路结构:对立电路(opposition circuits),当人类反馈强化学习(RLHF)改变预训练倾向时出现;以及路由电路(rout…

  9. RESEARCH · CL_10089 ·

    新的分支合并蒸馏方法创造了更小、高精度的LLM

    研究人员开发了一种名为分支合并蒸馏的新方法,用于创建更小、高性能的大型语言模型。该方法涉及将知识从大型教师模型选择性地蒸馏到专门的学生模型中,然后将这些模型合并以提高泛化能力。结果模型TinyR1-32B-Preview在数学、编码和科学基准测试中,其准确性优于其蒸馏版本,同时在特定数学测试中的表现几乎与教师模型相当。

  10. RESEARCH · CL_09344 ·

    SenseTime发布专为中国芯片优化的快速、开源图像AI模型

    中国AI公司SenseTime推出了SenseNova U1,这是一个专为速度而设计的开源图像生成和解释模型。与许多竞争对手不同,U1可以直接处理图像,无需将其转换为文本,从而减少了计算需求。该模型与中国制造的芯片兼容,鉴于美国对先进AI硬件的出口限制,这是一个关键特性。

  11. RESEARCH · CL_09205 ·

    研究:更友好的AI聊天机器人准确性更低,引发信任担忧

    一项新研究表明,旨在更友好和富有同情心的AI聊天机器人可能准确性较低。研究人员发现,对AI模型进行微调以展现更温暖的沟通风格,会导致其在包括医疗建议和事实回忆在内的各种任务中出现错误的响应显著增加。这种温暖与准确性之间的权衡引发了对AI系统可信度的担忧,尤其是在用于支持或陪伴等敏感应用时。

  12. RESEARCH · CL_09107 ·

    Stateful Transformers 提升流式推理性能;Intel 发布 AutoRound 量化工具包

    一篇新论文介绍了一种有状态的 Transformer 推理引擎,通过维护持久的 KV 缓存,显著加快了流式数据的处理速度。这种方法实现了与累积上下文大小无关的查询延迟,在市场数据基准测试中比现有引擎快了 5.9 倍。此外,Intel 发布了 AutoRound,一个用于 LLM 和 VLM 的先进量化工具包,可在超低比特宽度(2-4 位)下实现高精度和广泛的硬件兼容性,并与 vLLM 和 Transformers 等流行框架集成。

  13. RESEARCH · CL_09035 ·

    Alibaba's Qwen unveils FlashQLA for high-performance linear attention kernels

    Alibaba's Qwen team has released FlashQLA, a new set of high-performance linear attention kernels developed using TileLang. These kernels are designed to improve the efficiency of attention mechanisms in large language …

  14. SIGNIFICANT · CL_09127 ·

    丰e足食携手阿里云千问,发力无人零售AI应用

    运营着18万台无人零售柜的丰e足食(隶属于丰巢科技)已与阿里云达成合作,将其千问大语言模型整合到运营中。此次合作旨在加强AI在管理和决策中的作用,优化运营成本,提高效率。双方还将致力于制定无人零售领域AI的行业标准,利用丰e足食广泛网络的真实数据来优化AI模型,并创建可复制的解决方案以供更广泛的应用。

  15. TOOL · CL_08758 ·

    Alipay launches AI payment processing to support agentic economy

    Alipay has introduced a new AI payment processing product designed to facilitate transactions between businesses and autonomous AI agents. This solution allows companies, including small businesses and one-person operat…

  16. TOOL · CL_07909 ·

    开发者使用MCP协议为AI代理添加浏览器控制功能

    一位开发者详细介绍了他们如何增强名为n0x的AI代理以与其网络浏览器进行交互,使其超越了简单的文本生成。核心改进在于集成了模型上下文协议(MCP),使AI能够执行诸如打开网站、截屏和执行命令等操作。此次升级将AI从一个对话工具转变为一个能够执行基于网络任务的功能性代理。

  17. RESEARCH · CL_08315 ·

    LLM幻觉与承诺失败相关,引入新的量化框架

    一篇新论文提出,LLM幻觉并非源于知识缺乏,而是源于承诺失败,模型将概率质量分散到多个备选答案上,而不是集中于正确答案。这种现象随着模型规模的增大而增加,并且会因指令调优而加剧。另一篇论文介绍了GAMMA,一个用于混合精度量化的框架,该框架优化了LLM的比特分配,在内存限制下显著提高了准确性,并在Llama和Qwen模型上表现优于现有方法。此外,还开发了一个名为SciEval的基准,用于自动评估K-12科学教学材料,结果显示,当前主流…

  18. RESEARCH · CL_07014 ·

    TACO框架通过张量压缩将大模型训练吞吐量提升1.87倍

    研究人员推出了一种新颖的框架TACO,旨在提高大规模张量并行大语言模型(LLM)训练的效率。TACO采用基于FP8的中间张量压缩策略来解决通信开销问题,利用数据驱动的重塑和自适应Scale-Hadamard变换进行高保真量化。该框架还包含一个融合压缩算子,以减少内存流量和内核启动时间,从而更好地与通信重叠。使用GPT和Qwen模型进行的实验表明,TACO可以在几乎不损失准确性的情况下,将端到端吞吐量提高高达1.87倍。

  19. TOOL · CL_47613 ·

    Qwen 为门控 Delta 网络开发 FlashQLA 以实现高效注意力机制

    Qwen 开发了 FlashQLA,这是一套新的融合线性注意力内核,旨在兼容深度学习中的前向和后向传播。这些内核针对门控 Delta 网络(GDN)进行了优化,GDN 现在是 Qwen 模型家族的核心组成部分,包括 Qwen3-Next 及其后续迭代,如 Qwen3.5 和 Qwen3.6。此开发旨在提高具有扩展上下文窗口的大模型的效率和可扩展性。

  20. RESEARCH · CL_06011 ·

    DeepSeek新AI模型市场反响平淡,竞争日益激烈

    中国AI初创公司DeepSeek发布了其新DeepSeek-V4-Pro和DeepSeek-V4-Flash模型的预览版,但市场反应平淡。这与其之前推出的低成本AI模型(如DeepSeek-V3和DeepSeek-R1)获得的巨大关注形成鲜明对比,这些模型曾挑战了AI训练需要海量计算资源的必要性。分析人士认为,市场已经习惯了高效的模型开发,尽管V4模型有所改进,但与顶尖的开源竞争对手相比,其表现并未显著突出,尤其是在Kimi和Qwen…