PulseAugur
实时 14:18:48
English(EN) Colon-Bench: An Agentic Workflow for Scalable Dense Lesion Annotation in Full-Procedure Colonoscopy Videos

新的结肠镜检查AI基准Colon-Bench评估MLLMs

研究人员开发了Colon-Bench,一个用于训练AI模型处理结肠镜检查视频的新基准数据集。该数据集通过多阶段代理工作流生成,包含对超过30万个边界框和21.3万个分割掩模的详细标注,涵盖14个病灶类别。该基准用于评估最先进的多模态大语言模型(MLLMs),结果显示与SAM-3等现有模型相比,在医学领域的定位性能出奇地高。还引入了一种新颖的“colon-skill”提示策略,将零样本MLLM性能提高了高达9.7%。 AI

影响 为评估医学影像中的MLLMs建立了新标准,可能加速AI在结肠镜检查诊断中的应用。

排序理由 发布新的基准数据集及相关研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的结肠镜检查AI基准Colon-Bench评估MLLMs

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Abdullah Hamdi, Changchun Yang, Xin Gao ·

    Colon-Bench: An Agentic Workflow for Scalable Dense Lesion Annotation in Full-Procedure Colonoscopy Videos

    arXiv:2603.25645v2 Announce Type: replace-cross Abstract: Early screening via colonoscopy is critical for colon cancer prevention, yet developing robust AI systems for this domain is hindered by the lack of densely annotated, long-sequence video datasets. Existing datasets predom…