PulseAugur
实时 13:26:48
English(EN) On Aligning Hierarchical Standardized Embedding for Audio-visual Generalized Zero-shot Learning

新的AHSE方法增强了视听零样本学习

研究人员引入了一种名为对齐分层标准化嵌入(AHSE)的新方法,以改进视听广义零样本学习。AHSE通过标准化和分层对齐视听和文本嵌入来解决现有方法的局限性。该方法旨在减少分布不匹配,并在共享嵌入空间中保留语义和类别关系。在基准数据集上的实验表明,AHSE在零样本学习任务中取得了有竞争力的性能。 AI

影响 这项研究可能带来更强大、更准确的集成多种数据模态的分类系统。

排序理由 该集群包含一篇详细介绍特定机器学习任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Zihan Zhang, Jie Hong, Siyuan Fan, Yanghao Zhou, Pengfei Fang ·

    On Aligning Hierarchical Standardized Embedding for Audio-visual Generalized Zero-shot Learning

    arXiv:2606.11602v1 Announce Type: new Abstract: Audio-visual Generalized Zero-shot Learning (AV-GZSL) is a challenging task that aims to classify both seen and unseen objects or scenes by integrating data from audio and visual modalities. Recent studies primarily focus on fusing …