English(EN) On Aligning Hierarchical Standardized Embedding for Audio-visual Generalized Zero-shot Learning

新的AHSE方法增强了视听零样本学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-11 04:00

研究人员引入了一种名为对齐分层标准化嵌入（AHSE）的新方法，以改进视听广义零样本学习。AHSE通过标准化和分层对齐视听和文本嵌入来解决现有方法的局限性。该方法旨在减少分布不匹配，并在共享嵌入空间中保留语义和类别关系。在基准数据集上的实验表明，AHSE在零样本学习任务中取得了有竞争力的性能。 AI

影响这项研究可能带来更强大、更准确的集成多种数据模态的分类系统。

排序理由该集群包含一篇详细介绍特定机器学习任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Zihan Zhang, Jie Hong, Siyuan Fan, Yanghao Zhou, Pengfei Fang · 2026-06-11 04:00

On Aligning Hierarchical Standardized Embedding for Audio-visual Generalized Zero-shot Learning

arXiv:2606.11602v1 Announce Type: new Abstract: Audio-visual Generalized Zero-shot Learning (AV-GZSL) is a challenging task that aims to classify both seen and unseen objects or scenes by integrating data from audio and visual modalities. Recent studies primarily focus on fusing …