PulseAugur
实时 10:45:26
实体 MMStar

MMStar

PulseAugur coverage of MMStar — every cluster mentioning MMStar across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_04920 ·

    新的CGC框架提升多模态LLM的细粒度图像理解能力

    研究人员推出了一种名为组合式地面对比(CGC)的新框架,旨在增强多模态大语言模型(MLLMs)的细粒度多图像理解能力。该方法通过利用现有的单图像标注构建训练实例,解决了空间幻觉和物体恒常性等挑战。CGC利用跨图像和图像内对比学习,以及基于规则的空间奖励系统,来改进归因和对齐。该框架在MIG-Bench和VLM2-Bench等基准测试中展现了最先进的性能,并显示出对其他多模态任务的积极迁移学习效果。