PulseAugur
实时 22:28:57
English(EN) Fusion Embedding for Pose-Guided Person Image Synthesis with Diffusion Model

新的扩散模型框架增强了基于姿态的人物图像生成

研究人员开发了一个名为“用于基于姿态生成人物图像的融合嵌入”(FPDM)的新框架,使用扩散模型来改进基于指定姿态的人物图像生成。该方法通过对比学习明确地将融合的源姿态嵌入与目标图像嵌入对齐,并使用学习到的融合嵌入作为生成的条件信号。FPDM集成了图像-姿态融合模块来学习这些对齐的嵌入,并使用源外观、目标姿态和融合嵌入来指导条件扩散模型。在基准数据集上的实验表明,FPDM在纹理保真度和跨姿态和源变化的一致性方面有所提高。 AI

影响 提高了AI生成人物图像的保真度和一致性,可应用于虚拟试穿和数字替身等场景。

排序理由 这是一篇描述新图像生成方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Donghwna Lee, Kirok Kim, Jisu Lee, Kyungha Min, Wooju Kim ·

    基于扩散模型的姿态引导人物图像合成的融合嵌入

    arXiv:2412.07333v2 Announce Type: replace-cross Abstract: Pose-Guided Person Image Synthesis (PGPIS) aims to generate human images in specified poses while preserving the identity and appearance of a source image. This technology facilitates diverse applications, including virtua…