PulseAugur
实时 03:50:15
实体 Qwen ASR

Qwen ASR

PulseAugur coverage of Qwen ASR — every cluster mentioning Qwen ASR across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_120344 ·

    开源AI模型集成用于字幕视频创作

    一位Reddit用户在ComfyUI中演示了使用完全开源模型创建字幕视频的工作流程。该演示展示了Qwen Text-to-Speech (TTS)、LTX 2.3、Acestep、Qwen Automatic Speech Recognition (ASR)以及ffmpeg在字幕生成中的集成。

  2. TOOL · CL_56082 ·

    新的蒸馏方法用更少的数据提升ASR模型性能

    研究人员开发了一种数据高效的自动语音识别(ASR)模型训练方法,特别关注一个名为Ark-ASR的0.6B参数模型。通过从更大的Qwen-ASR教师模型进行策略内蒸馏,他们显著提高了Ark-ASR在普通话和英语基准测试上的性能。与现有方法相比,这种方法所需的监督音频数据大大减少,表明教师指导的训练可以有效地增强较小的ASR模型。