研究人员开发了一种新颖的文本到视频框架,用于生成逼真且可控的二维电影心脏磁共振(CMR)序列。该方法通过将空间结构与时间运动解耦,解决了公共CMR数据集稀缺的问题。一个扩散模型根据临床文本提示创建初始帧,而一个潜在流模型生成心脏运动,确保了时间一致性和提示的保真度。该系统在图像真实性方面达到了31.68的FID分数,在文本-图像对齐方面达到了31.04的CLIP分数,展示了其按需合成医疗数据的潜力。 AI
影响 能够按需生成高保真医疗成像数据,有望加速研究和临床应用。
排序理由 该集群包含一篇详细介绍新AI视频生成方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →