实体
Qwen ASR
Qwen ASR
PulseAugur coverage of Qwen ASR — every cluster mentioning Qwen ASR across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
开源AI模型集成用于字幕视频创作
一位Reddit用户在ComfyUI中演示了使用完全开源模型创建字幕视频的工作流程。该演示展示了Qwen Text-to-Speech (TTS)、LTX 2.3、Acestep、Qwen Automatic Speech Recognition (ASR)以及ffmpeg在字幕生成中的集成。
-
新的蒸馏方法用更少的数据提升ASR模型性能
研究人员开发了一种数据高效的自动语音识别(ASR)模型训练方法,特别关注一个名为Ark-ASR的0.6B参数模型。通过从更大的Qwen-ASR教师模型进行策略内蒸馏,他们显著提高了Ark-ASR在普通话和英语基准测试上的性能。与现有方法相比,这种方法所需的监督音频数据大大减少,表明教师指导的训练可以有效地增强较小的ASR模型。