PulseAugur
实时 13:54:59
English(EN) SIGMA: Semantic-Difference Instruction-Grounding Mask Annotator for Text-Driven Image Manipulation Localization

新的SIGMA方法可自动生成图像操纵定位掩码

研究人员开发了SIGMA,一种用于自动生成图像操纵定位(IML)数据集像素级掩码的新方法。SIGMA利用包含数百万原始和编辑图像对的现有图像编辑数据集,解决了低成本数据采集的挑战。该系统在视觉基础骨干网络中使用语义特征差异,并通过跨模态细化结合指令派生的空间先验,以准确识别操纵区域,甚至考虑了意外的副作用。SIGMA在性能上优于现有的掩码生成器,并且在应用于公共编辑语料库时,创建了一个大量的训练集,显著提高了各种IML检测器的性能。 AI

排序理由 这是一篇描述图像操纵定位新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Peiyu Zhuang, Jianquan Yang, Haodong Li, Zhuoying Cai, Ruitao Xie, Jishen Zeng, Baoying Chen, Jiwu Huang, Xiaochun Cao ·

    SIGMA:用于文本驱动图像操作定位的语义差异指令锚定掩码标注器

    arXiv:2605.27924v1 Announce Type: new Abstract: Text-driven image editing has advanced rapidly, but reliably localizing these manipulations requires image manipulation localization (IML) models trained on large pixel-annotated datasets, and there is still no low-cost way to obtai…