实体 Large Visual Language Models

Large Visual Language Models

PulseAugur coverage of Large Visual Language Models — every cluster mentioning Large Visual Language Models across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_79726 · Jun 9 · 04:00

新基准和方法提升LVLM在工业缺陷检测中的性能

研究人员推出了一项新的基准和数据集MMIO，旨在改进大型视觉语言模型（LVLM）在工业环境中的应用。该数据集包含跨越不同工业类别的80,000多个样本，解决了该领域零样本学习数据稀缺的问题。他们还提出了一种精炼文本-视觉提示（RTVP）方法，通过整合专家指导和自动生成视觉提示来增强泛化能力，并取得了最先进的成果。
RESEARCH · CL_11391 · Apr 30 · 08:01

视觉文本样式影响 LVLM 描述，尽管概念识别正确

一篇新的研究论文探讨了图像中视觉文本的样式如何影响大型视觉语言模型 (LVLM) 生成的描述。研究发现，即使 LVLM 正确识别了文本的概念，装饰性的文本样式也会影响模型分配给该概念的语义属性。这表明样式会渗入语义推理，凸显了在多媒体人工智能系统中进行样式感知评估和缓解的必要性。

新基准和方法提升LVLM在工业缺陷检测中的性能

视觉文本样式影响 LVLM 描述，尽管概念识别正确