PulseAugur
实时 08:53:50
English(EN) SAGE: An Expert-Annotated South Asian GI Endoscopy Dataset for Multimodal Learning and Hallucination Analysis

新基准解决胃肠内窥镜检查AI模型的幻觉问题

研究人员开发了新的基准和数据集,以解决用于胃肠内窥镜检查的视觉语言模型(VLM)中的幻觉问题。一项研究介绍了使用Gut-VLM数据集的基准,对五个VLM的九种幻觉检测方法进行了评估,发现ReXTrust等白盒方法表现明显更好。另一篇论文提出了SAGE数据集,该数据集专门从南亚地区收集,以对抗胃肠内窥镜检查AI中的人口偏见,并评估当前模型在不同数据集上的性能下降情况。 AI

影响 这些努力旨在提高胃肠内窥镜检查AI诊断工具的可靠性并减少偏见,从而可能带来更准确和公平的医疗保健。

排序理由 两篇研究论文介绍了用于评估医学影像AI模型(特别是胃肠内窥镜检查)的新数据集和基准。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新基准解决胃肠内窥镜检查AI模型的幻觉问题

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Aminu Lawal, Niyoj Oli, Sachin Acharya, Prashnna Gyawali, Maria Carmen Romano, Binod Bhattarai ·

    A Benchmark for Hallucination Detection in VLMs for Gastrointestinal Endoscopy

    arXiv:2606.24115v1 Announce Type: cross Abstract: Vision-language models (VLMs) are prone to hallucination, which remains a major barrier to their safe deployment in clinical practice. To date, most hallucination detection methods have been evaluated on radiology benchmarks such …

  2. arXiv cs.AI TIER_1 English(EN) · Binod Bhattarai ·

    SAGE:一个专家标注的南亚胃肠内窥镜数据集,用于多模态学习和幻觉分析

    Gastrointestinal cancers represent a growing health burden in the South Asian region, driven largely by rapid changes in socio-economic conditions & lifestyle habits. However, early diagnosis of such malignancies remains a significant challenge, largely due to a lack of modern eq…