研究人员探讨了不同的语音表示如何影响3D面部动画的质量。该研究比较了四类语音表示,并使用客观和感知测量方法,通过两个面部解码器评估了它们的有效性。研究结果表明,在语音表示中编码语音类别可以更准确地预测面部动画。 AI
影响 这项研究通过优化语音数据的使用,有望实现更真实、更准确的AI驱动的面部动画系统。
排序理由 该集群包含一篇在arXiv上发表的研究论文,详细介绍了对用于3D面部动画的语音表示的研究。
- arXiv
- Audio Visual Text-to-Speech
- 3D Facial Animation
- ASR-style objectives
- Audio Visual Text-to-Speech (AVTTS)
- Hugging Face
- neural codecs
- Speech Representations
- SSL features
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →