English(EN) Learning Language-Driven Sequence-Level Modal-Invariant Representations for Video-Based Visible-Infrared Person Re-Identification

新的LSMRL方法增强了可见光-红外行人重识别能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-26 04:00

研究人员开发了一种名为LSMRL的新方法，用于视频可见光-红外行人重识别。该方法旨在创建跨模态不变的序列级表示，这意味着无论输入是可见光还是红外图像，它都能识别个体。LSMRL包含用于时空特征学习、语义扩散和跨模态交互的模块，以提高特征一致性并缩小模态间的差距。该方法还引入了特定的损失函数，以增强这些表示的判别能力和泛化能力，并在大规模数据集上展示了卓越的性能。 AI

影响这项研究可以提高跨不同视觉光谱运行的行人重识别系统的准确性和效率。

排序理由该集群包含一篇详细介绍计算机视觉新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Xiaomei Yang, Antai Liu, Xizhan Gao, Fa Zhu, Sijie Niu, Giancarlo Fortino · 2026-06-26 04:00

Learning Language-Driven Sequence-Level Modal-Invariant Representations for Video-Based Visible-Infrared Person Re-Identification

arXiv:2601.12062v2 Announce Type: replace Abstract: The core of video-based visible-infrared person re-identification (VVI-ReID) lies in learning sequence-level modal-invariant representations across different modalities. Recent research tends to use modality-shared language prom…

报道来源 [1]

Learning Language-Driven Sequence-Level Modal-Invariant Representations for Video-Based Visible-Infrared Person Re-Identification

相关实体

相关话题