PulseAugur
实时 06:22:33

Pose-ICL 框架增强了图像生成中的 3D 姿态控制

研究人员推出 Pose-ICL,一个旨在改进主题定制图像生成中姿态控制的新框架。该方法利用 3D 感知的 In-Context Learning,使模型能够使用参考图像和姿态信息适应新主题。一个关键组件 Surface-Anchored Position Embedding (SAPE) 通过将图像 token 映射到体积边界框的表面坐标,提供显式的 3D 感知,从而提高生成图像的姿态准确性和身份一致性。 AI

影响 通过提高 3D 姿态准确性和身份一致性,增强了图像生成中的主题定制。

排序理由 这是一篇描述图像生成新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Mingyu You ·

    Pose-ICL:用于姿态可控主体定制的 3D 感知上下文内学习

    Subject Customization is a foundational task in modern image generation. By providing a few reference images and a text prompt, users can generate images of a specific object in any desired scene. However, existing methods still struggle to achieve effective pose control for cust…