研究人员推出了一种名为OneFocus的新型视觉语言模型,旨在增强X射线安检能力。为解决相关训练数据稀缺的问题,他们开发了MMXray基准数据集,包含超过52,000张X射线违禁品图像-描述对,以及用于合成数据生成的CleanDET和AnyContraSyn。OneFocus旨在执行多种任务,包括视觉问答、违禁品定位和分类,以期提高安全应用中的泛化能力和理解能力。 AI
影响 这项研究可能带来更有效的自动化违禁品检测系统,从而提高物流和运输业的安全性。
排序理由 该集群描述了一篇新发表在arXiv上的研究论文,详细介绍了一种用于X射线安检的新型视觉语言模型及相关数据集。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- AnyContraSyn
- arXiv
- CatalyzeX
- CleanDET
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- MMXray
- OneFocus
- OnePipe
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →