PulseAugur
实时 08:59:59
English(EN) One Stone, Three Birds: Self-adaptive Optimal Transport for Multi-VLM Selection, Adaptation, and Ensembling

新框架在无目标标签的情况下优化VLM选择和适应

研究人员开发了一个名为“一石三鸟”(OSTB)的新框架,以解决在目标标注稀缺的情况下部署视觉语言模型(VLM)所面临的挑战。OSTB使用自适应最优传输从一组固定的VLM中估计共识样本到类别的结构。然后,这种学习到的结构可以指导模型选择、目标适应和集成,从而在不更新VLM参数的情况下提高各种基准的性能。 AI

影响 为低数据场景下的VLM部署提供了一种新颖的方法,有可能提高现实世界应用的效率和准确性。

排序理由 介绍新颖框架和方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Qiyu Xu, Zhanxuan Hu, Yu Duan, Yonghang Tai, Huafeng Li, Quanxue Gao, Xiangyong Cao ·

    一石三鸟:用于多 VLM 选择、适应和集成自适应最优传输

    arXiv:2606.08126v1 Announce Type: new Abstract: Vision-language models (VLMs) enable visual recognition from semantic class descriptions, which makes them attractive when target annotations are scarce or unavailable. Most deployment pipelines, however, first choose a single VLM a…