研究人员开发了手语识别和翻译的新方法。一种方法使用深度学习流程,结合视频MAE视频Transformer将手语手势分类为英语单词,并使用Meta AI的NLLB-200模型将这些单词翻译成印地语、泰卢固语和孟加拉语等印度语言。另一项开发是SignNet-1M数据集,该数据集旨在通过使用3D高斯溅射和扩散模型等技术合成视角、背景和 the signer identity 的真实变化,来提高手语模型的鲁棒性。该数据集及其相关的基准测试旨在提高在现实条件下进行翻译和识别等任务的泛化能力。 AI
影响 手语识别和翻译模型的进步可以显著提高聋哑和听力障碍社区的可及性。
排序理由 该集群包含两篇研究论文,详细介绍了手语识别和翻译的新数据集和方法。
- AI4Bharat
- Hugging Face
- Indian Institute of Technology Madras
- Meta AI
- NLLB-200
- VideoMAE
- 3D Gaussian Splatting
- Chinese Sign Language
- German Sign Language
- SignNet-1M
- streamlit
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →