English(EN) MVCL-DAF++: Enhancing Multimodal Intent Recognition via Prototype-Aware Contrastive Alignment and Coarse-to-Fine Dynamic Attention Fusion

新模型通过原型对齐提升多模态意图识别能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 04:00

研究人员推出了MVCL-DAF++，这是一种多模态意图识别的改进模型，旨在提高语义基础和鲁棒性。新模型采用了原型感知对比对齐来增强语义一致性，并使用粗粒度到细粒度的注意力融合机制来实现分层跨模态交互。该方法在MIntRec和MIntRec2.0基准测试上取得了新的最先进成果，尤其提高了稀有类别的识别能力。 AI

影响增强了多模态理解能力，有望改进依赖于解释复杂、多源输入的应用程序。

排序理由该集群包含一篇详细介绍新模型和基准测试结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Haofeng Huang, Yifei Han, Long Zhang, Bin Li, Yangfan He, Yaxin Xue · 2026-06-08 04:00

MVCL-DAF++：通过原型感知对比学习和粗粒度到细粒度动态注意力融合增强多模态意图识别

arXiv:2509.17446v3 Announce Type: replace-cross Abstract: Multimodal intent recognition (MMIR) suffers from weak semantic grounding and poor robustness under noisy or rare-class conditions. We propose MVCL-DAF++, which extends MVCL-DAF with two key modules: (1) Prototype-aware co…

报道来源 [1]

MVCL-DAF++：通过原型感知对比学习和粗粒度到细粒度动态注意力融合增强多模态意图识别

相关话题