English(EN) Low Resource Multimodal Translation of Nepali Spoken Words into Emotion-Conditioned Sign Language Avatars

新框架将口语尼泊尔语翻译成情感条件化手语头像

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-26 04:00

研究人员开发了 NEST-V1，一个新颖的多模态框架，用于将口语尼泊尔语翻译成情感条件化手语头像。这项试点研究侧重于三种情感状态下的四个常用尼泊尔语单词，证明了生成富有表现力的手语头像的可行性。该系统利用共享声学编码器同时进行自动语音识别和情感分类，在保持适合边缘部署的参数效率的同时，实现了高精度。 AI

影响为听障社区建立实时、富有情感表现力的手语通信系统的技术基础。

排序理由详细介绍新多模态翻译框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jatin Bhusal, Salma Tamang · 2026-06-26 04:00

低资源多模态将尼泊尔口语翻译成情绪条件化手语虚拟形象

arXiv:2606.26107v1 Announce Type: cross Abstract: Sign language communication systems, that integrate emotional expression remain underexplored, particularly for low-resource languages. This pilot study presents NEST-V1 (Nepali Emotion and Speech Transformer - Version 1), a proof…

报道来源 [1]

低资源多模态将尼泊尔口语翻译成情绪条件化手语虚拟形象

相关实体

相关话题