English(EN) noisekit - CLI for generating realistic degraded speech datasets for ASR benchmarking [P]

Noisekit CLI 为 ASR 基准测试生成逼真的降级音频

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-27 13:06

一款名为 noisekit 的新命令行工具已发布，旨在帮助基准测试自动语音识别 (ASR) 系统。它通过应用各种噪声和失真条件来生成逼真的降级音频数据集，这些条件模拟了电话通话等真实场景。这使得开发人员能够创建带注释的嘈杂数据集，以进行更准确的性能评估，而不是依赖于干净的录音室录音数据。 AI

影响通过模拟真实的音频降级，能够更准确地评估 ASR 系统。

排序理由该集群描述了一个用于特定技术任务的新命令行工具的发布。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/MachineLearning TIER_1 English(EN) · /u/Karamouche · 2026-05-27 13:06

noisekit - 用于生成逼真降级语音数据集以进行 ASR 基准测试的 CLI [P]

<div class="md"><p>If you've ever tried to pick an STT vendor for a phone-based voice agent or call center product, you've probably hit this wall: you have plenty of real production audio, but it's unlabeled, so you can't compute WER on it. And the annotated public…