阿里巴巴的Qwen团队发布了Qwen3.5-LiveTranslate-Flash,这是一款先进的同声传译模型。该新模型基于Qwen3.5-Omni架构,通过整合音频输入和视觉上下文来增强实时翻译能力。此次升级旨在通过理解口头语言和视觉线索来提供更准确的翻译,超越其前身Qwen3-LiveTranslate的能力。 AI
影响 通过整合视觉上下文增强实时翻译能力,有可能提高多模态通信场景下的准确性。
排序理由 Frontier-lab模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →