PulseAugur
实时 04:29:02
English(EN) COCOLogic-V2: Identifying Logical Inconsistencies via Truly Hard-Negatives

新的COCOLogic-V2数据集挑战AI视觉推理能力

研究人员推出了COCOLogic-V2,一个旨在评估真实世界图像视觉归纳推理能力的新数据集。该数据集涵盖了广泛的一阶逻辑,并将样本分为正样本、近边界(NB)负样本和远边界(FB)负样本,以便对模型性能进行详细分析。当前模型在区分正样本和FB样本方面表现出熟练度,但在NB样本方面遇到困难,表明复杂的视觉推理仍然是一个重大挑战。 AI

影响 该数据集旨在推进视觉归纳推理方法,拓展AI在真实场景中理解复杂逻辑的能力边界。

排序理由 该集群描述了一篇介绍AI研究数据集的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的COCOLogic-V2数据集挑战AI视觉推理能力

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Wolfgang Stammer ·

    COCOLogic-V2:通过真正困难的负样本识别逻辑不一致性

    While interpretable models such as concept bottleneck models (CBMs) and program synthesis methods enable verification of model decisions, their evaluation is typically limited to simple tasks, leaving complex reasoning on real-world images largely unexplored. We introduce COCOLog…