PulseAugur
实时 09:51:33
English(EN) SeamEdit: A Black-Box VLM-Agnostic Pipeline for Large-Image Semantic Editing

SeamEdit 管道支持黑盒 VLM 图像编辑

研究人员推出 SeamEdit,这是一个专为使用视觉语言模型 (VLM) 对大型图像进行语义编辑而设计的新型管道。这种无需训练、模型不可知的方法将 VLM 视为黑盒预言机,解决了将闭源模型应用于分块编辑时出现的语义变形和可见接缝等问题。SeamEdit 采用五阶段流程,包括瓦片分解、VLM 修复、一致性校正、候选排序和接缝融合,以实现高质量的编辑,并自然地融入周围内容。 AI

影响 利用现有的 VLM 功能,能够对大型图像进行更复杂、更无缝的语义编辑。

排序理由 该集群包含一篇详细介绍使用 VLM 进行图像编辑新方法的论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Xiangyu Lyu, Dan Lei ·

    SeamEdit: A Black-Box VLM-Agnostic Pipeline for Large-Image Semantic Editing

    arXiv:2606.13041v1 Announce Type: new Abstract: Semantic region editing for large images must satisfy two requirements at the same time: high generative quality and natural integration with surrounding content. Some related methods rely on white-box models and leave the strong ge…

  2. arXiv cs.CV TIER_1 English(EN) · Dan Lei ·

    SeamEdit: A Black-Box VLM-Agnostic Pipeline for Large-Image Semantic Editing

    Semantic region editing for large images must satisfy two requirements at the same time: high generative quality and natural integration with surrounding content. Some related methods rely on white-box models and leave the strong generation capability of closed-source models unde…