PulseAugur
实时 12:36:37
实体 Vision Question Answering

Vision Question Answering

PulseAugur coverage of Vision Question Answering — every cluster mentioning Vision Question Answering across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93974 ·

    新综述梳理视觉推理和KB-VQA的进展

    两篇新的arXiv综述全面概述了计算机视觉中的视觉推理任务。第一篇论文详细介绍了知识驱动的视觉问答(KB-VQA)系统,按知识表示、检索和推理对其进行分类,并强调了大型语言模型(LLMs)对该领域的影响。第二篇综述提供了视觉推理的分类,将其分为五种类型:关系型、符号型、时间型、因果型和常识型,并考察了包括LLMs和多模态大型语言模型(MLLMs)在内的各种方法。两篇论文都指出了持续存在的挑战,并为推进这些AI能力勾勒了未来的研究方向。