English(EN) FormalASR: End-to-End Spoken Chinese to Formal Text

FormalASR 将中文语音端到端转换为正式文本

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了 FormalASR，一个新颖的端到端系统，旨在将中文语音直接转换为正式书面文本。这种方法绕过了 LLM 进行单独后编辑的需要，从而降低了延迟和计算成本。该系统利用了两个模型，参数量分别为 0.6B 和 1.7B，它们是从 Qwen3-ASR 微调而来，并在新创建的大规模数据集 WenetSpeech-Formal 和 Speechio-Formal 上进行了训练。 AI

影响为将口语转录为正式文本提供了一种更有效、更直接的方法，有可能改进下游 NLP 应用。

排序理由这是一篇描述新模型和数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Wanyi Ning, Yinshang Guo, Haitao Qian, Jiyuan Cheng, Weiyuan Feng, Yufei Zhang · 2026-06-09 04:00

FormalASR：端到端中文口语到正式文本转换

arXiv:2605.19266v2 Announce Type: replace-cross Abstract: Automatic speech recognition (ASR) systems are typically optimized for verbatim transcription, which preserves disfluencies, filler words, and informal spoken structures that are often unsuitable for downstream writing-ori…

报道来源 [1]

FormalASR：端到端中文口语到正式文本转换

相关实体

相关话题