研究人员开发了KM-Speaker,一个用于生成高质量语音驱动的3D面部动画的新框架。该系统同时提供全局风格控制和精确的帧级时间控制,解决了现有方法在可控性方面常常牺牲真实性的局限性。KM-Speaker将唇部运动与上半脸动态解耦,并保留全局风格上下文,与当前最先进的技术相比,在唇形同步准确性、风格保持和富有表现力的时间控制方面表现更优。 AI
影响 该框架有望显著提高语音驱动的3D动画的真实性和可控性,应用于配音和虚拟角色等领域。
排序理由 该集群包含一篇详细介绍新的3D面部动画框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →