研究人员开发了一个新的框架来评估用于诊断面部皮肤病的AI模型的可解释性。该框架利用了大型语言模型(LLMs),如GPT-5.5、Gemini 3.5 Flash和Claude Sonnet 4.6,来评估Grad-CAM生成的视觉解释。该研究将各种增强技术应用于EfficientNet-B0、MobileNetV3和ResNet18等分类模型,然后使用LLMs通过渐进式提示工程来判断视觉解释的准确性和可信度,以提高一致性。 AI
影响 通过改进模型可解释性的评估,这项研究可能带来更值得信赖的AI诊断工具。
排序理由 该集群包含一篇在arXiv上发表的学术论文,详细介绍了一个新的研究框架。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →