English(EN) Semi-Supervised Speech Confidence Detection using Pseudo-Labelling and Whisper Embeddings

新AI框架使用Whisper嵌入检测说话者置信度

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员开发了一个新的语音说话者置信度检测框架，将传统的声学特征与OpenAI的Whisper模型的嵌入相结合。为克服数据稀缺问题，他们采用了伪标签技术来扩充训练数据集。该系统通过使用协同注意力机制融合这些多样化的表示，实现了75%的准确率，旨在改善教育环境中的个性化反馈并支持口语技能发展。 AI

排序理由该集群包含一篇详细介绍语音分析新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Adam Wynn, Jingyun Wang, Xiangyu Tan · 2026-06-16 04:00

Semi-Supervised Speech Confidence Detection using Pseudo-Labelling and Whisper Embeddings

arXiv:2606.16505v1 Announce Type: cross Abstract: Understanding speaker confidence is crucial in educational settings, as it can enhance personalised feedback and improve learning outcomes. This study introduces a novel framework for detecting speaker confidence by integrating hu…