研究人员推出了一种名为 GeoEdit 的新方法,可在单张照片中精确操控对象,同时遵守 3D 物理约束。与现有 2D 方法在空间感知方面存在困难且可能导致透视失真不同,GeoEdit 采用了一种无需训练的 Lift-Manipulate-Render-Denoise 流程。该方法在 3D 中分离场景和对象,使用点对应进行对齐,并渲染带有深度图的几何对齐代理。然后,双分支去噪阶段会优化此代理,其中视频扩散主干保持对象身份,并将 3D 约束注入前景,同时背景自由去噪。该团队还开发了 GeoEditBench,这是一个用于评估对象平移、旋转和相机运动的姿态感知基准。 AI
影响 可在单张图像中实现更精确、物理上更一致的对象编辑,有望改进创意工具和图像生成。
排序理由 介绍一种新图像处理方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- CORE Recommender
- DagsHub
- Dual-Branch Denoising
- GeoEdit
- GeoEditBench
- Gotit.pub
- Hugging Face
- Lift-Manipulate-Render-Denoise
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →