阿里巴巴的 Qwen 团队发布了新一代全模态大语言模型 Qwen3.5-Omni,能够处理文本、图像、音频和视听内容。该系列模型包括 Plus、Flash 和 Light 版本,均支持 256k 上下文窗口,并能处理超过 10 小时的音频。其架构在推理和生成组件中均采用了混合注意力专家混合(MoE)方法。 AI
影响 将大语言模型的能力扩展到原生的音频和视频处理,可能催生更复杂的 AI 代理和应用。
排序理由 前沿实验室模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →