PulseAugur
实时 05:53:15
English(EN) Ethical and Technical Limits of Deepfake Speech Datasets

深度伪造语音数据集缺乏公平性,来源存在重叠

对39个深度伪造语音数据集的最新审计显示,其公平性和技术鲁棒性存在显著局限。研究人员发现,大多数数据集缺乏关键的人口统计学元数据,使得公平性评估几乎不可能,并阻碍了亚组分析。此外,这些数据集中用于真实语音的源语料库存在大量重叠,可能导致过度概括性声明,并破坏跨数据集评估。 AI

影响 凸显了可能阻碍公平、鲁棒的深度伪造语音检测系统开发和评估的关键数据局限性。

排序理由 该集群包含一篇详细介绍数据集审计的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Anton Firc ·

    深度伪造语音数据集的伦理与技术局限性

    Claims about the robustness and fairness of deepfake speech detectors are only as credible as the datasets used to train and evaluate those systems. We present a dataset-level audit of the deepfake speech landscape. We compile and analyze 39 deepfake speech datasets, examining ke…