Researchers find single hub text exploits vulnerabilities in CLIP cross-modal encoders

By PulseAugur Editorial · [3 sources] · 2026-04-30 10:08

Researchers have identified a vulnerability in cross-modal encoders like CLIP, which map text and images into a shared embedding space. They discovered that a single "hub text" can generate high similarity scores with numerous unrelated images, undermining evaluation metrics for tasks like image captioning and retrieval. This finding highlights practical security threats posed by the hubness problem in high-dimensional data. AI

IMPACT Reveals potential for adversarial attacks on multimodal AI systems, impacting evaluation reliability.

RANK_REASON Academic paper detailing a new method for identifying vulnerabilities in cross-modal encoders.

Read on arXiv cs.CL →

paper
safety

AI-generated summary · Google Gemini · from 3 sources. How we write summaries →

Researchers find single hub text exploits vulnerabilities in CLIP cross-modal encoders

COVERAGE [3]

arXiv cs.AI TIER_1 English(EN) · Hiroyuki Deguchi, Katsuki Chousa, Yusuke Sakai · 2026-05-01 04:00

One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness

arXiv:2604.27674v1 Announce Type: cross Abstract: The hubness problem, in which hub embeddings are close to many unrelated examples, occurs often in high-dimensional embedding spaces and may pose a practical threat for purposes such as information retrieval and automatic evaluati…
arXiv cs.CL TIER_1 English(EN) · Yusuke Sakai · 2026-04-30 10:08

One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness

The hubness problem, in which hub embeddings are close to many unrelated examples, occurs often in high-dimensional embedding spaces and may pose a practical threat for purposes such as information retrieval and automatic evaluation metrics. In particular, since cross-modal simil…
Hugging Face Daily Papers TIER_1 English(EN) · 2026-04-30 10:08

One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness

The hubness problem, in which hub embeddings are close to many unrelated examples, occurs often in high-dimensional embedding spaces and may pose a practical threat for purposes such as information retrieval and automatic evaluation metrics. In particular, since cross-modal simil…

COVERAGE [3]

One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness

One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness

One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness

RELATED ENTITIES

RELATED TOPICS