PulseAugur
实时 09:59:47
English(EN) BoxCtrl: 3D-Aware Visual Prompting for Geometric Image Editing

BoxCtrl框架实现精确3D几何图像编辑

研究人员推出BoxCtrl,一个用于精确3D几何图像编辑的新颖框架。该方法利用具有不同RGB颜色的3D边界框作为视觉提示投影到2D图像上,从而能够精确控制平移、缩放和旋转。BoxCtrl采用两阶段训练过程,首先在合成数据上进行监督微调,然后使用不成对的真实世界数据进行强化学习,以弥合领域差距。实验表明,BoxCtrl在各种几何编辑任务中取得了最先进的结果。 AI

影响 引入了一种精确3D几何图像编辑的新方法,有望改进图形设计和内容创作工具。

排序理由 详细介绍图像编辑新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

BoxCtrl框架实现精确3D几何图像编辑

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Jing Liao ·

    BoxCtrl:用于几何图像编辑的3D感知视觉提示

    As instruction-based editing models and multimodal large language models advance, diverse image editing tasks have become feasible. However, achieving precise and consistent geometric image editing, such as translating, scaling, and rotating in 3D space, remains a major challenge…