Pose-ICL 框架增强了图像生成中的 3D 姿态控制

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 14:13

研究人员推出 Pose-ICL，一个旨在改进主题定制图像生成中姿态控制的新框架。该方法利用 3D 感知的 In-Context Learning，使模型能够使用参考图像和姿态信息适应新主题。一个关键组件 Surface-Anchored Position Embedding (SAPE) 通过将图像 token 映射到体积边界框的表面坐标，提供显式的 3D 感知，从而提高生成图像的姿态准确性和身份一致性。 AI

影响通过提高 3D 姿态准确性和身份一致性，增强了图像生成中的主题定制。

排序理由这是一篇描述图像生成新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Mingyu You · 2026-06-09 14:13

Pose-ICL：用于姿态可控主体定制的 3D 感知上下文内学习

Subject Customization is a foundational task in modern image generation. By providing a few reference images and a text prompt, users can generate images of a specific object in any desired scene. However, existing methods still struggle to achieve effective pose control for cust…

报道来源 [1]

Pose-ICL：用于姿态可控主体定制的 3D 感知上下文内学习

相关话题