PulseAugur
实时 08:46:56
English(EN) SIREM: Speech-Informed MRI Reconstruction with Learned Sampling

AI通过整合声学数据增强语音实时MRI

研究人员开发了通过整合声学信息与视觉数据来实时MRI(rtMRI)语音产生的新方法。一种方法,语音引导多模态学习,使用从语音派生的语音学表示来指导发音器定位,并融合视觉和声学编码器以实现精确分割。另一种方法,SIREM,通过结合音频驱动组件与MRI数据来重建rtMRI,从而在保持解剖学准确性的同时实现更快的采集和重建。这些技术旨在改善语音科学和临床应用中声道的运动可视化。 AI

影响 医学影像多模态AI的进步可能带来更快、更准确的语音和声道疾病诊断工具。

排序理由 两篇学术论文提出了语音信息MRI重建的新方法。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

AI通过整合声学数据增强语音实时MRI

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Paula Andrea Pérez-Toro ·

    Speech-Guided Multimodal Learning for Vocal Tract Segmentation in Real-Time MRI

    Segmenting vocal tract articulators in real-time MRI (rtMRI) is a challenging dynamic image segmentation problem characterized by low contrast, rapid motion, and limited spatial resolution. However, while rtMRI acquisitions may provide synchronized acoustic signals, existing meth…

  2. arXiv cs.CV TIER_1 English(EN) · Paula A. Perez-Toro ·

    SIREM: Speech-Informed MRI Reconstruction with Learned Sampling

    Real-time magnetic resonance imaging (rtMRI) of speech production enables non-invasive visualization of dynamic vocal-tract motion and is valuable for speech science and clinical assessment. However, rtMRI is fundamentally constrained by trade-offs among spatial resolution, tempo…