English(EN) LaCoVL-FER: Landmark-Guided Contrastive Learning Network with Vision-Language Enhancement for Facial Expression Recognition

新网络利用地标和视觉语言模型增强人脸表情识别

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 13:15

研究人员开发了一个名为 LaCoVL-FER 的新网络，以改进人脸表情识别，尤其是在具有挑战性的真实世界条件下。该模型将面部地标的几何信息与像 CLIP 这样的视觉语言模型的语义理解相结合。该方法使用地标引导编码器进行自适应特征融合，并采用视觉语言增强策略来优化视觉表示和调整文本提示，从而实现更鲁棒和泛化的表情识别。 AI

影响为面部表情识别引入了一种新颖的架构，有可能在复杂、真实的场景中提高准确性。

排序理由详细介绍特定 AI 任务新颖网络架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Yifan Xia · 2026-05-19 13:15

LaCoVL-FER：用于面部表情识别的具有视觉语言增强的地标引导对比学习网络

Facial Expression Recognition (FER) in the wild is still challenging due to uncontrolled variations in pose, occlusion, and illumination. Most existing attention-based methods primarily rely on visual appearance cues, suffering from attention redundancy and instability, which lim…

报道来源 [1]

LaCoVL-FER：用于面部表情识别的具有视觉语言增强的地标引导对比学习网络

相关实体

相关话题