English(EN) SAGE: An Expert-Annotated South Asian GI Endoscopy Dataset for Multimodal Learning and Hallucination Analysis

新基准解决胃肠内窥镜检查AI模型的幻觉问题

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-20 16:53

研究人员开发了新的基准和数据集，以解决用于胃肠内窥镜检查的视觉语言模型（VLM）中的幻觉问题。一项研究介绍了使用Gut-VLM数据集的基准，对五个VLM的九种幻觉检测方法进行了评估，发现ReXTrust等白盒方法表现明显更好。另一篇论文提出了SAGE数据集，该数据集专门从南亚地区收集，以对抗胃肠内窥镜检查AI中的人口偏见，并评估当前模型在不同数据集上的性能下降情况。 AI

影响这些努力旨在提高胃肠内窥镜检查AI诊断工具的可靠性并减少偏见，从而可能带来更准确和公平的医疗保健。

排序理由两篇研究论文介绍了用于评估医学影像AI模型（特别是胃肠内窥镜检查）的新数据集和基准。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Aminu Lawal, Niyoj Oli, Sachin Acharya, Prashnna Gyawali, Maria Carmen Romano, Binod Bhattarai · 2026-06-24 04:00

A Benchmark for Hallucination Detection in VLMs for Gastrointestinal Endoscopy

arXiv:2606.24115v1 Announce Type: cross Abstract: Vision-language models (VLMs) are prone to hallucination, which remains a major barrier to their safe deployment in clinical practice. To date, most hallucination detection methods have been evaluated on radiology benchmarks such …
arXiv cs.AI TIER_1 English(EN) · Binod Bhattarai · 2026-06-20 16:53

SAGE：一个专家标注的南亚胃肠内窥镜数据集，用于多模态学习和幻觉分析

Gastrointestinal cancers represent a growing health burden in the South Asian region, driven largely by rapid changes in socio-economic conditions & lifestyle habits. However, early diagnosis of such malignancies remains a significant challenge, largely due to a lack of modern eq…

报道来源 [2]

A Benchmark for Hallucination Detection in VLMs for Gastrointestinal Endoscopy

SAGE：一个专家标注的南亚胃肠内窥镜数据集，用于多模态学习和幻觉分析

相关实体

相关话题