研究人员开发了 RoPEMover,一种在保持几何一致性的同时,在单个图像中重定位对象的新颖方法。该方法利用扩散 Transformer 中的深度感知旋转位置嵌入 (RoPE) 来编码 3D 空间结构,从而实现精确的对象位移和场景感知更新。RoPEMover 使用合成数据和有限的真实世界数据进行训练,在保持对象身份、生成合理的新内容以及更新阴影和光照等场景相关效果方面,均展现了最先进的性能。 AI
影响 该方法可以实现更复杂的图像编辑工具和内容生成应用。
排序理由 该集群包含一篇详细介绍图像处理新方法的 ist 研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →