研究人员开发了GH-ESD,一个用于发现实例级视觉任务(如目标检测和分割)中系统性故障的新框架。与之前关注图像级分类的方法不同,GH-ESD利用大型语言模型(LLM)和视觉语言模型(VLM)来生成和验证关于导致错误的关联性和空间接地视觉模式的假设。该框架还引入了GESD,一个专为实例级误差切片发现设计的新基准数据集,该数据集已显示出比现有方法更好的性能。 AI
影响 引入了一种识别和理解视觉模型故障的新颖方法,有望带来更鲁棒的AI系统。
排序理由 介绍计算机视觉研究新方法和数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →