Grad-CAM++
PulseAugur coverage of Grad-CAM++ — every cluster mentioning Grad-CAM++ across labs, papers, and developer communities, ranked by signal.
1 天有情绪数据
-
AI教程使用Grad-CAM验证医学影像模型
本教程演示了如何使用PyTorch的ResNet18模型构建和评估阿尔茨海默病MRI分类流程。它强调了模型通过利用特定于数据集的伪影而非真正的医学特征来获得高准确率的常见陷阱。该指南强调了在临床部署之前,使用Grad-CAM等技术可视化模型注意力并确保其关注相关解剖区域的重要性。
-
AI模型在诊断心脏瓣膜病症方面达到高准确率
研究人员开发了一种可解释的AI模型,用于从超声心动图图像诊断双瓣主动脉瓣(BAV)。该模型是一个在90个患者研究中训练的堆叠集成模型,达到了0.907的F1分数和0.877的召回率。Grad-CAM和SHAP值等技术被用于定位证据和量化贡献,确保了透明度和可审计性。这项AI技术有助于更早地检测BAV,尤其是在缺乏专业知识的地区。
-
AI框架使用LLM生成可解释的医学影像诊断
研究人员开发了一个新框架,将视觉显著性方法与大型语言模型相结合,为医学影像创建可解释的AI。该系统通过生成人类可理解的诊断报告来增强脑肿瘤分类的深度学习模型。该方法使用显著性图来识别肿瘤,将这些发现映射到解剖结构,然后条件化Grok3、Mistral和LLaMA等LLM以生成放射学风格的叙述。
-
视觉变换器在分割宇宙原晕方面优于CNN
研究人员开发了深度学习模型,特别是U-Net变换器和基于V-Net的CNN,用于分割早期宇宙密度场中的原晕。基于变换器的网络表现出优越的性能,在每个晕类别的分割质量方面实现了低于百分之一的误差,并且优于传统的 extsc{pinocchio}模型,尤其是在低质量晕和边界重建方面。该研究还检查了密度和潮汐剪切等输入特征的影响,并使用Grad-CAM可视化CNN的内部工作原理。
-
Researchers develop stable, explainable AI for elderly fall detection
Researchers have developed a new framework for skeleton-based fall detection that uses a temporally stabilized attribution mechanism called T-SHAP. This method enhances the interpretability of AI models used in elderly …
-
AI模型高效检测无人机图像中的桥梁裂缝
研究人员开发了一个轻量级卷积神经网络框架,用于无人机桥梁检测中的实时裂缝分类。该系统解决了裂缝特征弱、成像质量差、类别不平衡和计算能力有限等挑战。它包含一个注意力模块,以增强对裂缝轨迹的关注,并以最少的参数数量实现了高推理速度,为结构健康监测提供了实用的解决方案。
-
新框架应对面部识别系统的伪装化妆攻击
研究人员开发了一个新颖的框架来检测伪装化妆演示攻击,这对人脸识别系统尤其具有挑战性。所提出的方法采用两阶段方法:首先,一个风格不变的全脸模型提取注意力分数,然后,一个基于块的分析执行局部判别。该框架在一个新构建的数据集上进行了测试,并展示了强大的泛化能力,优于先前的方法。
-
TumorXAI 使用自监督学习进行脑肿瘤 MRI 分类
研究人员开发了 TumorXAI,一个用于从 MRI 扫描中对脑肿瘤进行分类的自监督深度学习框架。该方法通过利用 SimCLR、BYOL、DINO 和 Moco v3 等技术,解决了标记医疗数据有限的挑战。该框架取得了高准确率,其中 SimCLR 在包含 4,448 张 MRI 的数据集上达到了 99.64%,并且还集成了可解释人工智能方法以增强模型的可解释性。
-
AI研究综述了用于食品行业的XAI技术
一篇新的综述文章对食品工程领域的可解释人工智能(XAI)技术进行了分类,旨在提高AI模型的透明度和可靠性。文章强调,尽管XAI在食品工程领域具有通过识别影响预测的关键数据特征(如光谱波长或图像区域)来提高食品质量控制的潜力,但该领域对其利用不足。文章讨论了SHAP和Grad-CAM等技术作为确定影响因素的方法,从而帮助检查员并鼓励AI在食品安全和评估中的更广泛应用。
-
一种基于图增强知识蒸馏的双流视觉Transformer结合区域感知注意力用于胃肠道疾病分类及可解释AI
研究人员开发了一种新颖的双流深度学习框架,用于从医学影像中对胃肠道疾病进行分类。该系统采用教师-学生知识蒸馏方法,结合了用于全局上下文的Swin Transformer和用于细粒度特征的Vision Transformer。学生网络是一个紧凑的Tiny-ViT,在数据集1上达到了0.9978的高准确率,在数据集2上达到了0.9928,AUC为1.0000,同时还提供了更快的推理速度和更低的计算复杂度。可解释性分析证实了该模型依赖于临床…
-
AI模型提供可解释的糖尿病视网膜病变分级,并附带视觉和文本解释
研究人员开发了一种新的糖尿病视网膜病变(DR)分级方法,该方法将深度学习模型与可解释的解释相结合。该方法使用卷积神经网络(CNN)和Transformer架构,通过加权软投票集成实现了高达0.934的QWK分数。为了实现可解释性,该研究使用Grad-CAM++生成了视觉归因图,并使用视觉语言模型生成了文本解释,旨在从视网膜图像中提供具有临床意义的见解。