English(EN) CLIP-AUTT: Test-Time Personalization with Action Unit Prompting for Fine-Grained Video Emotion Recognition

新的CLIP-AUTT方法通过个性化提示增强视频情感识别

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-03 04:00

研究人员开发了CLIP-AUTT，一种用于细粒度视频情感识别的新型测试时个性化方法。该方法利用面部动作单元（AUs）作为CLIP视觉语言模型中的结构化文本提示，以捕捉细微的面部表情。CLIP-AUTT通过采用熵引导的时间窗口选择和提示调优，动态地将这些AU提示适配到未见过的主体的视频中，从而在保持时间一致性的同时实现主体特定适配。在基准数据集上的实验表明，CLIP-AUTT在面部表情识别和测试时适应方面优于现有的基于CLIP的方法。 AI

影响通过实现提示的个性化适配，增强了细粒度视频情感识别，有望改进人机交互和情感计算中的应用。

排序理由这是一篇详细介绍视频情感识别新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Muhammad Osama Zeeshan, Masoumeh Sharafi, Benoit Savary, Alessandro Lameiras Koerich, Marco Pedersoli, Eric Granger · 2026-07-03 04:00

CLIP-AUTT: Test-Time Personalization with Action Unit Prompting for Fine-Grained Video Emotion Recognition

arXiv:2603.27999v3 Announce Type: replace Abstract: Personalization in emotion recognition (ER) is essential for accurate interpretation of subtle and subject-specific expressive patterns. Recent advances in vision-language models (VLMs), such as CLIP, demonstrate strong potentia…

报道来源 [1]

CLIP-AUTT: Test-Time Personalization with Action Unit Prompting for Fine-Grained Video Emotion Recognition

相关实体

相关话题