研究人员开发了新的基准和数据集,以解决用于胃肠内窥镜检查的视觉语言模型(VLM)中的幻觉问题。一项研究介绍了使用Gut-VLM数据集的基准,对五个VLM的九种幻觉检测方法进行了评估,发现ReXTrust等白盒方法表现明显更好。另一篇论文提出了SAGE数据集,该数据集专门从南亚地区收集,以对抗胃肠内窥镜检查AI中的人口偏见,并评估当前模型在不同数据集上的性能下降情况。 AI
影响 这些努力旨在提高胃肠内窥镜检查AI诊断工具的可靠性并减少偏见,从而可能带来更准确和公平的医疗保健。
排序理由 两篇研究论文介绍了用于评估医学影像AI模型(特别是胃肠内窥镜检查)的新数据集和基准。
- AI
- Gastrointestinal cancers
- hallucination analysis
- image captioning
- large multimodal models (LMMs)
- multi-label classification
- multimodal learning
- SAGE
- visual question answering (VQA)
- Gastrointestinal Endoscopy
- Gut-VLM dataset
- hallucination
- MedGemma-4B
- ReXTrust
- SAGE dataset
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →