PulseAugur
实时 10:29:58
English(EN) QC-GAN: A Parameter-Efficient Quaternion Conformer GAN for High-Fidelity Speech Enhancement

新的QC-GAN提供参数高效的语音增强

研究人员开发了QC-GAN,一种新的参数高效语音增强框架,它结合了四元数Conformer生成器和基于MetricGAN的训练。该方法利用Hamilton乘积来编码幅度和相位,在保持相互依赖性的同时显著减少了参数数量。一个度量学习判别器优化了感知质量,在VoiceBank+DEMAND数据集上仅用0.89M参数就达到了3.48的PESQ分数,一个拥有35K参数的较小变体也表现出强劲的性能。该模型在DNS-Challenge 3数据集上展示了泛化能力。 AI

影响 这项研究引入了一种更参数高效的语音增强方法,有可能在计算资源有限的设备上实现更高质量的音频处理。

排序理由 该集群包含一篇详细介绍新的语音增强模型和方法的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →

新的QC-GAN提供参数高效的语音增强

报道来源 [3]

  1. arXiv cs.AI TIER_1 English(EN) · Shogo Yamauchi, Hideaki Tamori, Makoto Sakai, Yosuke Yamano, Tohru Nitta ·

    QC-GAN: A Parameter-Efficient Quaternion Conformer GAN for High-Fidelity Speech Enhancement

    arXiv:2606.18611v1 Announce Type: cross Abstract: We propose a parameter-efficient speech enhancement framework, Quaternion Conformer GAN (QC-GAN), which combines a Quaternion Conformer generator with MetricGAN-based training. The Hamilton product encodes the magnitude and phase …

  2. arXiv stat.ML TIER_1 English(EN) · Tohru Nitta ·

    QC-GAN:一种参数高效的四元数Conformer GAN,用于高保真语音增强

    We propose a parameter-efficient speech enhancement framework, Quaternion Conformer GAN (QC-GAN), which combines a Quaternion Conformer generator with MetricGAN-based training. The Hamilton product encodes the magnitude and phase via structured weight sharing, reducing the number…

  3. arXiv stat.ML TIER_1 English(EN) · Tohru Nitta ·

    QC-GAN:一种参数高效的四元数Conformer GAN,用于高保真语音增强

    We propose a parameter-efficient speech enhancement framework, Quaternion Conformer GAN (QC-GAN), which combines a Quaternion Conformer generator with MetricGAN-based training. The Hamilton product encodes the magnitude and phase via structured weight sharing, reducing the number…