PulseAugur
实时 09:05:02
English(EN) FormalASR: End-to-End Spoken Chinese to Formal Text

FormalASR 将中文语音端到端转换为正式文本

研究人员开发了 FormalASR,一个新颖的端到端系统,旨在将中文语音直接转换为正式书面文本。这种方法绕过了 LLM 进行单独后编辑的需要,从而降低了延迟和计算成本。该系统利用了两个模型,参数量分别为 0.6B 和 1.7B,它们是从 Qwen3-ASR 微调而来,并在新创建的大规模数据集 WenetSpeech-FormalSpeechio-Formal 上进行了训练。 AI

影响 为将口语转录为正式文本提供了一种更有效、更直接的方法,有可能改进下游 NLP 应用。

排序理由 这是一篇描述新模型和数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Wanyi Ning, Yinshang Guo, Haitao Qian, Jiyuan Cheng, Weiyuan Feng, Yufei Zhang ·

    FormalASR:端到端中文口语到正式文本转换

    arXiv:2605.19266v2 Announce Type: replace-cross Abstract: Automatic speech recognition (ASR) systems are typically optimized for verbatim transcription, which preserves disfluencies, filler words, and informal spoken structures that are often unsuitable for downstream writing-ori…