English(EN) Cross-Modal-Domain Generalization Through Semantically Aligned Discrete Representations

新框架CoDAAR通过离散表示增强多模态学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-12 14:03

研究人员开发了一个名为CoDAAR的新框架，通过创建语义对齐的离散表示来改进多模态学习。该方法平衡了跨模态泛化能力与保留模态特定结构的需求。CoDAAR利用离散时间对齐和级联语义对齐，在事件分类和视频分割等各种跨模态泛化基准测试中取得了最先进的性能。 AI

影响引入了一种新的离散且可泛化的多模态表示学习范式，有望提高各种AI任务的性能。

排序理由发布了一篇详细介绍新框架及其在基准测试中性能的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Zahra Ahmadi · 2026-05-12 14:03

通过语义对齐的离散表示实现跨模态域泛化

Multimodal learning seeks to integrate information across diverse sensory sources, yet current approaches struggle to balance cross-modal generalizability with modality-specific structure. Continuous (implicit) methods preserve fine-grained priors but render generalization challe…