研究人员开发了通过整合声学信息与视觉数据来实时MRI(rtMRI)语音产生的新方法。一种方法,语音引导多模态学习,使用从语音派生的语音学表示来指导发音器定位,并融合视觉和声学编码器以实现精确分割。另一种方法,SIREM,通过结合音频驱动组件与MRI数据来重建rtMRI,从而在保持解剖学准确性的同时实现更快的采集和重建。这些技术旨在改善语音科学和临床应用中声道的运动可视化。 AI
影响 医学影像多模态AI的进步可能带来更快、更准确的语音和声道疾病诊断工具。
排序理由 两篇学术论文提出了语音信息MRI重建的新方法。
- Paula Andrea Perez-Toro
- 75-Speaker~Annot-16
- real-time MRI
- Speech-Guided Multimodal Learning
- USC speech rtMRI benchmark
- USC-TIMIT
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →