English(EN) SIGMA: Semantic-Difference Instruction-Grounding Mask Annotator for Text-Driven Image Manipulation Localization

新的SIGMA方法可自动生成图像操纵定位掩码

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 04:00

研究人员开发了SIGMA，一种用于自动生成图像操纵定位（IML）数据集像素级掩码的新方法。SIGMA利用包含数百万原始和编辑图像对的现有图像编辑数据集，解决了低成本数据采集的挑战。该系统在视觉基础骨干网络中使用语义特征差异，并通过跨模态细化结合指令派生的空间先验，以准确识别操纵区域，甚至考虑了意外的副作用。SIGMA在性能上优于现有的掩码生成器，并且在应用于公共编辑语料库时，创建了一个大量的训练集，显著提高了各种IML检测器的性能。 AI

排序理由这是一篇描述图像操纵定位新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Peiyu Zhuang, Jianquan Yang, Haodong Li, Zhuoying Cai, Ruitao Xie, Jishen Zeng, Baoying Chen, Jiwu Huang, Xiaochun Cao · 2026-05-28 04:00

SIGMA：用于文本驱动图像操作定位的语义差异指令锚定掩码标注器

arXiv:2605.27924v1 Announce Type: new Abstract: Text-driven image editing has advanced rapidly, but reliably localizing these manipulations requires image manipulation localization (IML) models trained on large pixel-annotated datasets, and there is still no low-cost way to obtai…

报道来源 [1]

SIGMA：用于文本驱动图像操作定位的语义差异指令锚定掩码标注器

相关实体

相关话题