PulseAugur
实时 09:44:12
English(EN) OneFocus: Enabling Real-World X-ray Security Screening with a Unified Vision-Language Model

新型视觉语言模型提升X射线安检效率

研究人员推出了一种名为OneFocus的新型视觉语言模型,旨在增强X射线安检能力。为解决相关训练数据稀缺的问题,他们开发了MMXray基准数据集,包含超过52,000张X射线违禁品图像-描述对,以及用于合成数据生成的CleanDET和AnyContraSyn。OneFocus旨在执行多种任务,包括视觉问答、违禁品定位和分类,以期提高安全应用中的泛化能力和理解能力。 AI

影响 这项研究可能带来更有效的自动化违禁品检测系统,从而提高物流和运输业的安全性。

排序理由 该集群描述了一篇新发表在arXiv上的研究论文,详细介绍了一种用于X射线安检的新型视觉语言模型及相关数据集。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Jiali Wen, Hongxia Gao, Litao Li, Yixin Chen, Kaijie Zhang, Qianyun Liu, Xiaoqin Wen ·

    OneFocus: Enabling Real-World X-ray Security Screening with a Unified Vision-Language Model

    arXiv:2606.15663v1 Announce Type: new Abstract: X-ray contraband detection is critical for security in large-scale logistics and transportation, yet conventional detectors struggle to adapt to emerging contraband types and lack fundamental visual understanding. Vision-language mo…