PulseAugur
实时 12:59:40
English(EN) CLIP-AUTT: Test-Time Personalization with Action Unit Prompting for Fine-Grained Video Emotion Recognition

新的CLIP-AUTT方法通过个性化提示增强视频情感识别

研究人员开发了CLIP-AUTT,一种用于细粒度视频情感识别的新型测试时个性化方法。该方法利用面部动作单元(AUs)作为CLIP视觉语言模型中的结构化文本提示,以捕捉细微的面部表情。CLIP-AUTT通过采用熵引导的时间窗口选择和提示调优,动态地将这些AU提示适配到未见过的主体的视频中,从而在保持时间一致性的同时实现主体特定适配。在基准数据集上的实验表明,CLIP-AUTT在面部表情识别和测试时适应方面优于现有的基于CLIP的方法。 AI

影响 通过实现提示的个性化适配,增强了细粒度视频情感识别,有望改进人机交互和情感计算中的应用。

排序理由 这是一篇详细介绍视频情感识别新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的CLIP-AUTT方法通过个性化提示增强视频情感识别

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Muhammad Osama Zeeshan, Masoumeh Sharafi, Benoit Savary, Alessandro Lameiras Koerich, Marco Pedersoli, Eric Granger ·

    CLIP-AUTT: Test-Time Personalization with Action Unit Prompting for Fine-Grained Video Emotion Recognition

    arXiv:2603.27999v3 Announce Type: replace Abstract: Personalization in emotion recognition (ER) is essential for accurate interpretation of subtle and subject-specific expressive patterns. Recent advances in vision-language models (VLMs), such as CLIP, demonstrate strong potentia…