实体 Qwen ASR

Qwen ASR

PulseAugur coverage of Qwen ASR — every cluster mentioning Qwen ASR across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_120344 · Jul 1 · 14:02

开源AI模型集成用于字幕视频创作

一位Reddit用户在ComfyUI中演示了使用完全开源模型创建字幕视频的工作流程。该演示展示了Qwen Text-to-Speech (TTS)、LTX 2.3、Acestep、Qwen Automatic Speech Recognition (ASR)以及ffmpeg在字幕生成中的集成。
TOOL · CL_56082 · May 28 · 04:00

新的蒸馏方法用更少的数据提升ASR模型性能

研究人员开发了一种数据高效的自动语音识别（ASR）模型训练方法，特别关注一个名为Ark-ASR的0.6B参数模型。通过从更大的Qwen-ASR教师模型进行策略内蒸馏，他们显著提高了Ark-ASR在普通话和英语基准测试上的性能。与现有方法相比，这种方法所需的监督音频数据大大减少，表明教师指导的训练可以有效地增强较小的ASR模型。