PulseAugur
实时 18:25:08
English(EN) ForensicsTok: Forensics-Guided Tokenized Modeling for Image Tampering Localization

ForensicsTok 使用标记生成实现精确的图像篡改定位

研究人员推出了一种新颖的图像篡改定位方法 ForensicsTok,将该任务重新构建为自回归序列生成问题。该方法直接生成标记序列来预测精确的掩码,绕过了传统拼接式流水线的瓶颈。ForensicsTok 包含一个标记飞溅解码器(Token Splatting Decoder),用于将标记映射到掩码,以及一个分层专家融合模块(Hierarchical Expert Fusion module),用于整合来自取证专家模型的多尺度特征,从而提高鲁棒性和准确性。 AI

影响 这项研究可能带来更强大、更准确的篡改图像检测工具,对数字取证和内容验证产生影响。

排序理由 该集群包含一篇详细介绍图像篡改定位新方法的论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

ForensicsTok 使用标记生成实现精确的图像篡改定位

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Lei Xu, Haowei Wang, Shen Chen, Taiping Yao, Bin Li, Changsheng Chen ·

    ForensicsTok: Forensics-Guided Tokenized Modeling for Image Tampering Localization

    arXiv:2606.24538v1 Announce Type: new Abstract: Multi-modal Large Language Models (MLLMs) offer powerful reasoning for forensic tasks, yet existing approaches utilizing exogenous segmentation decoders often suffer from suboptimal localization. The reliance on stitched pipelines i…

  2. arXiv cs.CV TIER_1 English(EN) · Changsheng Chen ·

    ForensicsTok: Forensics-Guided Tokenized Modeling for Image Tampering Localization

    Multi-modal Large Language Models (MLLMs) offer powerful reasoning for forensic tasks, yet existing approaches utilizing exogenous segmentation decoders often suffer from suboptimal localization. The reliance on stitched pipelines introduces information bottlenecks during backpro…