PulseAugur
实时 11:20:15

新的Hummus数据集测试AI对幽默多模态隐喻的理解能力

研究人员推出了Hummus数据集,这是一个包含1000个图像-标题对的新数据集,旨在评估多模态大语言模型(MLLMs)对幽默多模态隐喻的理解能力。该数据集受幽默和隐喻理论的启发,采用专家开发的标注方案创建。使用Hummus数据集进行的初步实验显示,当前的多模态大语言模型在有效整合视觉和文本信息以理解幽默多模态隐喻方面存在困难。 AI

影响 凸显了当前AI理解细微幽默和隐喻能力的局限性,指明了未来模型发展的方向。

排序理由 该集群包含一篇介绍新数据集及相关研究成果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Xiaoyu Tong, Zhi Zhang, Pia Sommerauer, Martha Lewis, Ekaterina Shutova ·

    Hummus:一个包含幽默多模态隐喻使用的数据集

    arXiv:2504.02983v3 Announce Type: replace-cross Abstract: Metaphor and humor share a lot of common ground, and metaphor is one of the most common humorous mechanisms. This study focuses on the humorous capacity of multimodal metaphors, which has not received due attention in the …