English(EN) AMR: Adaptive Modality Routing for Multimodal Polyglot Speaker Identification

新的自适应模态路由提高了说话人识别的准确性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了一种自适应模态路由（AMR）系统，以提高多模态说话人识别的性能，尤其是在模态缺失或语言不匹配等具有挑战性的实际条件下。AMR系统动态评估输入质量，并整合来自音频和面部嵌入的信息。在POLY-SIM 2026挑战数据集上的实验结果表明，该系统在各种协议下均表现出高准确性，显著优于基线融合方法。 AI

影响这项研究可能带来在多样化和嘈杂环境中更鲁棒、更准确的说话人识别系统。

排序理由该集群包含一篇详细介绍多模态说话人识别新方法的 ist 研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Chuxiao Zuo, Yao Zhu, Minqiang Xu, Manhong Wang, Yunke Zhang, Fei Huang · 2026-06-30 04:00

AMR: Adaptive Modality Routing for Multimodal Polyglot Speaker Identification

arXiv:2606.29335v1 Announce Type: cross Abstract: Multimodal speaker identification systems face two key challenges in real-world deployment: missing modalities and language mismatch between training and testing conditions. In practical scenarios, background multi-speaker convers…

报道来源 [1]

AMR: Adaptive Modality Routing for Multimodal Polyglot Speaker Identification

相关话题