PulseAugur
实时 06:25:27
English(EN) SeamEdit: A Black-Box VLM-Agnostic Pipeline for Large-Image Semantic Editing

SeamEdit 管道实现黑盒 VLM 语义图像编辑

研究人员开发了 SeamEdit,一种新颖的管道,旨在将任何视觉语言模型 (VLM) 作为黑盒预言机用于大型图像的语义编辑。这种无需训练的方法解决了在将闭源模型应用于分块编辑时出现的语义变形、对齐漂移和可见接缝等常见问题。SeamEdit 采用包括块分解、VLM 修复、一致性校正、接缝风险排名和接缝融合在内的五阶段过程,以实现高质量的编辑,并自然地融入周围图像内容。 AI

排序理由 这是一篇描述新图像编辑方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Xiangyu Lyu, Dan Lei ·

    SeamEdit: A Black-Box VLM-Agnostic Pipeline for Large-Image Semantic Editing

    arXiv:2606.13041v1 Announce Type: new Abstract: Semantic region editing for large images must satisfy two requirements at the same time: high generative quality and natural integration with surrounding content. Some related methods rely on white-box models and leave the strong ge…