研究人员推出了COCOTree,这是一个用于开放树状视觉分解任务的新数据集和基准。该任务涉及将图像分割成具有灵活粒度的视觉组件的层次树。该数据集是使用一种新颖的流程生成的,该流程结合了大型视觉语言模型和SAM 3,用于语义推理和几何基础,产生了超过2.1K张图像和1.8M个结构节点,拥有3.5K个标签的开放词汇表。还提出了一种新的评估指标Open Tree Quality (OTQ),用于评估掩码精度、标签准确性和结构一致性。 AI
影响 支持分层图像分割和视觉分解任务的新研究。
排序理由 该集群描述了一个新颖计算机视觉任务的新数据集和基准,包括提出的评估指标及其生成方法。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →