PulseAugur
实时 14:17:03
English(EN) GH-ESD: Grounded Hypothesis-Driven Error Slice Discovery for Instance-Level Vision Tasks

新框架GH-ESD利用LLM发现视觉模型错误 · arXiv研究

研究人员开发了GH-ESD,一个用于发现实例级视觉任务(如目标检测和分割)中系统性故障的新框架。与之前关注图像级分类的方法不同,GH-ESD利用大型语言模型(LLM)和视觉语言模型(VLM)来生成和验证关于导致错误的关联性和空间接地视觉模式的假设。该框架还引入了GESD,一个专为实例级误差切片发现设计的新基准数据集,该数据集已显示出比现有方法更好的性能。 AI

影响 引入了一种识别和理解视觉模型故障的新颖方法,有望带来更鲁棒的AI系统。

排序理由 介绍计算机视觉研究新方法和数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新框架GH-ESD利用LLM发现视觉模型错误 · arXiv研究

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Wei Zhang, Chaoqun Wang, Zixuan Guan, Sam Kao, Pengfei Zhao, Peng Wu, Sifeng He ·

    GH-ESD: Grounded Hypothesis-Driven Error Slice Discovery for Instance-Level Vision Tasks

    arXiv:2512.24592v2 Announce Type: replace Abstract: Systematic failures of vision models on semantically coherent subsets, known as error slices, reveal limitations in robustness and evaluation. Existing slice discovery approaches largely model slices as clusters in representatio…