PulseAugur
实时 09:14:48
English(EN) KM-Speaker: Keypoint-Based Style Control for High-Quality Speech-Driven 3D Facial Animation and Dialogue Localization

新的KM-Speaker框架实现了高质量、可控的3D面部动画

研究人员开发了KM-Speaker,一个用于生成高质量语音驱动的3D面部动画的新框架。该系统同时提供全局风格控制和精确的帧级时间控制,解决了现有方法在可控性方面常常牺牲真实性的局限性。KM-Speaker将唇部运动与上半脸动态解耦,并保留全局风格上下文,与当前最先进的技术相比,在唇形同步准确性、风格保持和富有表现力的时间控制方面表现更优。 AI

影响 该框架有望显著提高语音驱动的3D动画的真实性和可控性,应用于配音和虚拟角色等领域。

排序理由 该集群包含一篇详细介绍新的3D面部动画框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的KM-Speaker框架实现了高质量、可控的3D面部动画

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Arthur Josi, Emeline Got, Abdallah Dib, Luiz Gustavo Hafemann, Rafael M. O. Cruz ·

    KM-Speaker: Keypoint-Based Style Control for High-Quality Speech-Driven 3D Facial Animation and Dialogue Localization

    arXiv:2606.28568v1 Announce Type: cross Abstract: Speech-driven 3D facial animation methods face significant challenges in simultaneously achieving high-fidelity motion and precise artistic control at production quality. Existing controllable models typically learn global style c…