研究人员发现了一种针对多模态大语言模型(MLLM)级联的新漏洞,称为强制推迟攻击(FDA)。该攻击操纵弱模型的置信度分数,导致级联持续将查询路由到计算成本更高的强模型。FDA 利用通用的边界触发器来实现这一点,其性能优于现有的对抗性图像和提示注入方法。研究结果揭示了 MLLM 级联中一个新的攻击面,可能导致计算使用量在不直接影响答案准确性的情况下意外增加。 AI
影响 凸显了多模态大语言模型架构中的新漏洞,可能增加运营成本并需要新的安全考量。
排序理由 详细介绍大语言模型级联新攻击向量的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- Forced Deferral Attack
- Gotit.pub
- Hugging Face
- MLLM cascades
- Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →