研究人员推出CogPortrait,一个新颖的两阶段框架,用于生成具有眼部区域细粒度控制的肖像动画。该系统利用三个思维链多模态大语言模型(MLLMs)代理将高级标签转换为详细的面部关键点。然后,一个基于DiT的视频生成骨干网络合成动画,并结合先进技术以提高视觉质量和身份一致性,尤其是在具有挑战性的边界情况下。 AI
影响 这项研究引入了一种新颖的肖像动画方法,通过对眼睛等面部特征提供更精确的控制,有可能提高AI生成角色的真实感和表现力。
排序理由 该集群包含一篇详细介绍新肖像动画框架的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →