研究人员开发了SEAM,一个旨在实时准确地区分脚本化语音和自发语音的新框架,特别用于面试护栏。该系统解决了基准性能因语料库特定的捷径而非真正的语音风格检测而被夸大的问题。SEAM包含统一的预处理、捷径感知采样、非语音增强以及紧凑的DistilHuBERT骨干网络,在8秒窗口的外部评估集上实现了0.971的ROC-AUC。该框架的有效性归因于其捷径预防组件,表明鲁棒的检测依赖于模型架构以及精心设计的数据和评估。 AI
影响 该框架可以通过更好地区分真实回答和排练过的回答来提高AI驱动的面试分析工具的准确性。
排序理由 这是一篇详细介绍用于语音检测的新框架和模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →