English(EN) KM-Speaker: Keypoint-Based Style Control for High-Quality Speech-Driven 3D Facial Animation and Dialogue Localization

新的KM-Speaker框架实现了高质量、可控的3D面部动画

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了KM-Speaker，一个用于生成高质量语音驱动的3D面部动画的新框架。该系统同时提供全局风格控制和精确的帧级时间控制，解决了现有方法在可控性方面常常牺牲真实性的局限性。KM-Speaker将唇部运动与上半脸动态解耦，并保留全局风格上下文，与当前最先进的技术相比，在唇形同步准确性、风格保持和富有表现力的时间控制方面表现更优。 AI

影响该框架有望显著提高语音驱动的3D动画的真实性和可控性，应用于配音和虚拟角色等领域。

排序理由该集群包含一篇详细介绍新的3D面部动画框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

KM-Speaker

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Arthur Josi, Emeline Got, Abdallah Dib, Luiz Gustavo Hafemann, Rafael M. O. Cruz · 2026-06-30 04:00

KM-Speaker: Keypoint-Based Style Control for High-Quality Speech-Driven 3D Facial Animation and Dialogue Localization

arXiv:2606.28568v1 Announce Type: cross Abstract: Speech-driven 3D facial animation methods face significant challenges in simultaneously achieving high-fidelity motion and precise artistic control at production quality. Existing controllable models typically learn global style c…

报道来源 [1]

KM-Speaker: Keypoint-Based Style Control for High-Quality Speech-Driven 3D Facial Animation and Dialogue Localization

相关话题