研究人员推出 Pose-ICL,一个旨在改进主题定制图像生成中姿态控制的新框架。该方法利用 3D 感知的 In-Context Learning,使模型能够使用参考图像和姿态信息适应新主题。一个关键组件 Surface-Anchored Position Embedding (SAPE) 通过将图像 token 映射到体积边界框的表面坐标,提供显式的 3D 感知,从而提高生成图像的姿态准确性和身份一致性。 AI
影响 通过提高 3D 姿态准确性和身份一致性,增强了图像生成中的主题定制。
排序理由 这是一篇描述图像生成新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →