English(EN) OneFocus: Enabling Real-World X-ray Security Screening with a Unified Vision-Language Model

新型视觉语言模型提升X射线安检效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员推出了一种名为OneFocus的新型视觉语言模型，旨在增强X射线安检能力。为解决相关训练数据稀缺的问题，他们开发了MMXray基准数据集，包含超过52,000张X射线违禁品图像-描述对，以及用于合成数据生成的CleanDET和AnyContraSyn。OneFocus旨在执行多种任务，包括视觉问答、违禁品定位和分类，以期提高安全应用中的泛化能力和理解能力。 AI

影响这项研究可能带来更有效的自动化违禁品检测系统，从而提高物流和运输业的安全性。

排序理由该集群描述了一篇新发表在arXiv上的研究论文，详细介绍了一种用于X射线安检的新型视觉语言模型及相关数据集。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Jiali Wen, Hongxia Gao, Litao Li, Yixin Chen, Kaijie Zhang, Qianyun Liu, Xiaoqin Wen · 2026-06-16 04:00

OneFocus: Enabling Real-World X-ray Security Screening with a Unified Vision-Language Model

arXiv:2606.15663v1 Announce Type: new Abstract: X-ray contraband detection is critical for security in large-scale logistics and transportation, yet conventional detectors struggle to adapt to emerging contraband types and lack fundamental visual understanding. Vision-language mo…

报道来源 [1]

OneFocus: Enabling Real-World X-ray Security Screening with a Unified Vision-Language Model

相关实体

相关话题