研究人员开发了 FormalASR,一个新颖的端到端系统,旨在将中文语音直接转换为正式书面文本。这种方法绕过了 LLM 进行单独后编辑的需要,从而降低了延迟和计算成本。该系统利用了两个模型,参数量分别为 0.6B 和 1.7B,它们是从 Qwen3-ASR 微调而来,并在新创建的大规模数据集 WenetSpeech-Formal 和 Speechio-Formal 上进行了训练。 AI
影响 为将口语转录为正式文本提供了一种更有效、更直接的方法,有可能改进下游 NLP 应用。
排序理由 这是一篇描述新模型和数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →