Grad-CAM++ · PulseAugur

新框架通过可解释的AI特征增强肿瘤分类

研究人员开发了一个新框架，将深度学习与可解释AI技术相结合，用于发现和验证用于肿瘤分类的影像组学特征。该方法使用深度学习进行分割，并利用Grad-CAM等注意力机制来识别关键区域，然后使用SHAP来解释影像组学特征。该框架旨在提高成像特征的预测性能和生物学可解释性，为无创肿瘤表征提供更具可重复性的解决方案。

TOOL · CL_128789 · Jul 7 · 04:00

新的AG-EfficientNet改进了监控图像中的罪犯识别

研究人员开发了一个名为AG-EfficientNet的新框架，以改进监控图像中的罪犯识别。该模型集成了EfficientNet-B0和卷积块注意力模块（CBAM），以便在低分辨率和运动模糊等挑战性条件下更好地学习面部特征。该系统还采用了多尺度特征融合策略和混合Softmax-Triplet优化来增强身份区分能力，在基准数据集上达到了98.2%的识别准确率。

TOOL · CL_119679 · Jul 1 · 04:00

可解释AI在心力衰竭检测方面展现潜力但面临局限

最近对20项研究的回顾表明，虽然可解释人工智能（XAI）在检测和表征B期心力衰竭方面显示出潜力，但其目前的实施受到限制。关键问题包括XAI方法采用不一致，SHAP是最常用的但通常不足，并且在分析中缺乏对性别和种族亚组的考虑。此外，XAI输出的评估和外部验证常常不足，阻碍了通用性和临床应用。

TOOL · CL_118072 · Jun 30 · 04:00

AI 系统使用几何归一化技术，在 X 光片中准确检测肺炎和 COVID-19

研究人员开发了一种自动化系统，通过对肺部区域进行几何归一化来识别胸部 X 光片中的肺炎和 COVID-19。该系统采用 ResNet-18 模型进行标志点检测，然后使用广义普氏分析和仿射变换进行几何归一化。一个单独的 ResNet-18 分类器随后将图像分类为 COVID-19、病毒性肺炎或正常。该方法在 COVID-19Radiography Database 上取得了高精度，表明与原始图像或伪影掩盖图像相比，解剖对齐可以实现更鲁棒…

TOOL · CL_110014 · Jun 25 · 04:00

KIGNet：面向可解释喷注识别的物理驱动图学习

研究人员开发了KIGNet，一种用于高能物理中可解释喷注识别的新图神经网络。KIGNet将角向分离、相对横向动量、动量分数和不变质量平方等运动学变量整合到其分类过程中。该模型表明它学习到了物理上可解释的表示，其中角向分离和相对横向动量是分类中最主要的因素，这与QCD辐射的理论预测一致。KIGNet在基准数据集上取得了最先进的性能，与现有方法相比，在准确性和表示质量方面都有显著提高。

RESEARCH · CL_109614 · Jun 24 · 06:45

Blasto-Net：用于卵裂球分析的AI模型 · 跟踪到2个来源

研究人员开发了Blasto-Net，这是一种新颖的多任务深度学习模型，专为体外受精（IVF）中的卵裂球进行全面分析而设计。该模型可同时执行关键区域（ZP、TE、ICM）的分割、形态分级以及着床结果的预测。Blasto-Net采用EfficientNet-B3编码器和UNet风格的解码器，并通过注意力模块进行增强，以捕获语义和边界信息，并采用专门的头部和复合损失函数来处理不同的区域拓扑结构。在公共数据集上进行评估，Blasto-Net在…

RESEARCH · CL_107933 · Jun 23 · 08:34

TrOCR 适配中世纪手稿识别，研究发现

研究人员探索了将 TrOCR 模型应用于中世纪手稿的文字识别（HTR）任务，该任务因模型在现代文本上预训练而变得复杂。通过对 13 世纪意大利手稿（I-CT 91 "Cortonese"）和 READ-16 基准进行的受控实验，他们研究了对比度归一化、数据增强和层冻结对准确性的影响。研究发现，移除对比度归一化后，字符错误率（CER）为 7.84%，与专用基线相当，并且特定的层冻结策略可以跨数据集转移，但建议进行特定数据集的重新验证。研…

RESEARCH · CL_99954 · Jun 18 · 16:19

深度学习框架通过提高可解释性来增强精子形态学分类

研究人员开发了一种注意力引导的深度学习框架，以提高精子形态学分类的可解释性和准确性。通过将预训练的EfficientNet-B0模型与卷积块注意力模块（CBAM）集成，该系统有效地关注了关键的精子头部特征。该方法在公共数据集上实现了90.2%和93.9%的高准确率，优于简单的模型，并为分类提供了视觉解释。

TOOL · CL_97660 · Jun 17 · 05:42

新方法增强了皮肤病变医学图像分割

研究人员开发了PEFT-MedSAM，一种用于Medical Segment Anything Model (MedSAM) 的参数高效微调方法，以改进皮肤镜图像中皮肤病变的分割。该技术冻结了预训练的图像和提示编码器，仅训练轻量级的掩码解码器。在ISIC 2018数据集上的实验表明，PEFT-MedSAM实现了0.9411的Dice系数，优于完全训练的U-Net基线和零样本MedSAM推理。在PH2数据集上的进一步验证产生了0.946…

RESEARCH · CL_96083 · Jun 16 · 02:38

新研究通过先进的轮廓测量技术改进三维表面测量

两篇新研究论文探讨了用于三维表面测量的条纹投影轮廓测量技术的进展。第一篇论文《诊断和修复长距离单次曝光条纹投影轮廓测量中的形状先验捷径》介绍了PhiCalNet，这是一种通过解决形状先验捷径来显著提高长距离测量精度的架构。第二篇论文《用于反射和透明物体高分辨率三维表面测量的基于接触的条纹投影轮廓测量法》提出了一种基于接触的方法，提高了复杂表面的深度精度，优于现有的GelSight传感器。

RESEARCH · CL_93065 · Jun 15 · 14:37

大语言模型评估皮肤病诊断中的人工智能可解释性

研究人员开发了一个新的框架来评估用于诊断面部皮肤病的AI模型的可解释性。该框架利用了大型语言模型（LLMs），如GPT-5.5、Gemini 3.5 Flash和Claude Sonnet 4.6，来评估Grad-CAM生成的视觉解释。该研究将各种增强技术应用于EfficientNet-B0、MobileNetV3和ResNet18等分类模型，然后使用LLMs通过渐进式提示工程来判断视觉解释的准确性和可信度，以提高一致性。

RESEARCH · CL_90992 · Jun 12 · 17:50

深度学习模型在植物病害分类中取得高准确率

研究人员开发了先进的深度学习框架，用于从叶部图像分类植物病害，并取得了高准确率。一项研究侧重于柠檬叶部病害，利用了 InceptionV3 和 MobileNetV2 等集成模型，通过对抗性训练达到 99.27% 的准确率以增强鲁棒性。另一个框架 CottonLeafVision 采用了 DenseNet201、InceptionV3 和 VGG19 等模型对棉花叶部病害进行分类，其中 DenseNet201 达到了 98% 的准确率…

TOOL · CL_66144 · Jun 2 · 04:00

新型可解释AI模型从时域数据中检测震颤

研究人员开发了一种新颖的两阶段分层框架，可直接从时域运动学数据中检测震颤。该方法结合了深度卷积网络和长短期记忆网络，随后使用视觉Transformer来学习和分类整个试验中的震颤模式。虽然在不同身体部位的F1分数从0.594到0.947不等，表现尚可，但并未超越当前最先进的频域方法。然而，该框架的优点是预处理需求极少，并且通过注意力权重和Grad-CAM提供可解释性，突出了震颤的时间和解剖学模式。

RESEARCH · CL_56534 · May 27 · 15:24

新攻击方法JECA^2 针对法医视觉语言模型一致性

研究人员推出了一种新颖的对抗攻击方法JECA^2，旨在挑战法医视觉语言模型（VLM）的鲁棒性。该攻击专门针对VLM在图像真实性判断与其自然语言解释之间的一致性。JECA^2操纵视觉归因并优化文本解释，使其与期望的判断保持一致，在白盒场景下，与现有方法相比，展示了更高的攻击成功率和改进的判断-解释一致性。研究结果突显了基于解释的法医VLM的一个关键失效模式，并表明需要进行更全面的鲁棒性评估。

TOOL · CL_51493 · May 26 · 04:00

新的审计协议评估视觉检测中AI解释的忠实度

研究人员开发了一种新的方法来审计用于工业视觉检测的深度学习模型所生成的解释。该“架构感知”协议评估解释方法在多大程度上忠实地识别了对模型决策至关重要的图像区域。研究发现，解释的忠实度高度依赖于所使用的特定模型架构、解释器技术和扰动方法，这表明解释路径应与模型架构协同设计，并附带量化的忠实度指标。

TOOL · CL_42397 · May 21 · 08:37

AI教程使用Grad-CAM验证医学影像模型

本教程演示了如何使用PyTorch的ResNet18模型构建和评估阿尔茨海默病MRI分类流程。它强调了模型通过利用特定于数据集的伪影而非真正的医学特征来获得高准确率的常见陷阱。该指南强调了在临床部署之前，使用Grad-CAM等技术可视化模型注意力并确保其关注相关解剖区域的重要性。

RESEARCH · CL_30722 · May 13 · 16:10

AI模型在诊断心脏瓣膜病症方面达到高准确率

研究人员开发了一种可解释的AI模型，用于从超声心动图图像诊断双瓣主动脉瓣（BAV）。该模型是一个在90个患者研究中训练的堆叠集成模型，达到了0.907的F1分数和0.877的召回率。Grad-CAM和SHAP值等技术被用于定位证据和量化贡献，确保了透明度和可审计性。这项AI技术有助于更早地检测BAV，尤其是在缺乏专业知识的地区。

RESEARCH · CL_21812 · May 7 · 13:08

AI框架使用LLM生成可解释的医学影像诊断

研究人员开发了一个新框架，将视觉显著性方法与大型语言模型相结合，为医学影像创建可解释的AI。该系统通过生成人类可理解的诊断报告来增强脑肿瘤分类的深度学习模型。该方法使用显著性图来识别肿瘤，将这些发现映射到解剖结构，然后条件化Grok3、Mistral和LLaMA等LLM以生成放射学风格的叙述。

TOOL · CL_20772 · May 7 · 04:00

视觉变换器在分割宇宙原晕方面优于CNN

研究人员开发了深度学习模型，特别是U-Net变换器和基于V-Net的CNN，用于分割早期宇宙密度场中的原晕。基于变换器的网络表现出优越的性能，在每个晕类别的分割质量方面实现了低于百分之一的误差，并且优于传统的 extsc{pinocchio}模型，尤其是在低质量晕和边界重建方面。该研究还检查了密度和潮汐剪切等输入特征的影响，并使用Grad-CAM可视化CNN的内部工作原理。

TOOL · CL_15795 · May 5 · 04:00

研究人员开发用于老年人跌倒检测的稳定、可解释的AI

研究人员开发了一种新的基于骨骼的跌倒检测框架，该框架使用一种称为T-SHAP的时间稳定归因机制。该方法通过提供运动动力学的稳定且有意义的解释，增强了用于老年人监测的AI模型的可解释性。该系统实现了高精度和低延迟，使其适用于实时应用，并且其解释突出了与跌倒相关的生物力学相关模式。