一篇新的研究论文引入了光谱敏感性定理来解释大型自动语音识别(ASR)模型中的幻觉。该定理预测了一个相变,模型从信号衰减转变为秩-1崩溃。该理论在Whisper模型上进行了测试,结果显示中间版本经历了结构分解,而较大的模型则进入了一个寻求压缩的吸引子状态,使其与声学证据脱钩。 AI
影响 提供了一个理论框架来理解并可能减轻ASR模型中的幻觉。
排序理由 学术论文,详细介绍了新的理论框架和实验验证。[lever_c_demoted from research: ic=1 ai=1.0]
- Kirill Borodin
- large-v3-turbo
- Self-Attention
- Spectral Sensitivity Theorem
- Tiny
- Whisper
- Whisper models
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →