PulseAugur
实时 17:59:53
English(EN) Brain-Adapter: A Dual-Stream Vision-Language MIL Framework for Comprehensive 3D CT Diagnosis of Acute Intracranial Pathologies

新的Brain-Adapter框架利用VLM和LLM增强3D CT扫描诊断

研究人员开发了Brain-Adapter,一个新颖的双流多实例学习(MIL)框架,用于3D脑部CT扫描的自动诊断。该框架通过引入一个使用诊断句子作为语义查询的文本条件注意力机制,有效地将预训练的2D视觉语言模型(VLM)的能力转移到3D体积数据上。一个并行的视觉MIL流捕获全局扫描特征,两个流都由通过大型语言模型(LLM)提取的标签进行监督。该系统包含一个不确定性感知细化模块来校准和融合预测,通过减少对密集手动注释的需求,显著优于现有的3D模型和标准MIL方法。 AI

影响 该框架为分析3D CT扫描提供了一个可扩展且临床可行的解决方案,有可能提高危重症监护环境下的诊断速度和准确性。

排序理由 该集群包含一篇详细介绍医学图像分析新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的Brain-Adapter框架利用VLM和LLM增强3D CT扫描诊断

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Lichi Zhang ·

    Brain-Adapter: A Dual-Stream Vision-Language MIL Framework for Comprehensive 3D CT Diagnosis of Acute Intracranial Pathologies

    Automated diagnosis of 3D brain CT scans is essential for critical care, yet it remains challenging due to the heavy reliance on manual annotations and the limited semantic understanding of conventional models. While 2D foundation vision-language models (VLMs) have shown remarkab…