研究人员推出了COCOLogic-V2,一个旨在评估真实世界图像视觉归纳推理能力的新数据集。该数据集涵盖了广泛的一阶逻辑,并将样本分为正样本、近边界(NB)负样本和远边界(FB)负样本,以便对模型性能进行详细分析。当前模型在区分正样本和FB样本方面表现出熟练度,但在NB样本方面遇到困难,表明复杂的视觉推理仍然是一个重大挑战。 AI
影响 该数据集旨在推进视觉归纳推理方法,拓展AI在真实场景中理解复杂逻辑的能力边界。
排序理由 该集群描述了一篇介绍AI研究数据集的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- COCOLogic-V2
- Concept Bottleneck Models
- first-order logic
- Hugging Face
- program synthesis
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →