PulseAugur
实时 19:28:11
(TL) Count Anything at Any Granularity

新模型HieraCount利用大型数据集解决多粒度对象计数问题

研究人员提出了一种新的开放世界对象计数方法,通过将问题重新定义为多粒度计数来解决当前方法的脆弱性。该方法通过视觉示例和包括否定提示在内的细粒度文本,在五个不同级别上明确定义所需的计数粒度。为了支持这一点,他们开发了一个使用3D合成和基于VLM的过滤的自动数据扩展管道,创建了KubriCount,这是迄今为止最大的计数任务数据集,并训练了一个名为HieraCount的模型,该模型显著提高了准确性和泛化能力。 AI

影响 通过明确处理计数粒度,提高了对象计数的准确性和泛化能力,可能使计算机视觉和机器人领域的应用受益。

排序理由 该集群描述了一篇介绍用于对象计数的新模型和数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新模型HieraCount利用大型数据集解决多粒度对象计数问题

报道来源 [1]

  1. Hugging Face Daily Papers TIER_1 (TL) ·

    Count Anything at Any Granularity

    Open-world object counting remains brittle: despite rapid advances in vision-language models (VLMs), reliably counting the objects a user intends is far from solved. We argue that a central reason is that counting granularity is left implicit; users may refer to a specific identi…