两篇新研究论文探讨了大型语言模型(LLM)和大型视觉语言模型(LVLM)的漏洞和防御。第一篇论文介绍了提示的鲁棒性(RoP),这是一种旨在通过纠正输入错误和生成最优引导提示来增强LLM对抗对抗性扰动的韧性的策略。第二篇论文详细介绍了一种多轮自适应提示攻击(MAPA),该攻击通过交替进行文本-视觉攻击并迭代优化攻击轨迹来放大恶意响应,从而针对LVLM,并在多个基准测试中优于现有方法。 AI
影响 新研究突显了LLM和LVLM的漏洞,表明需要更鲁棒的提示策略和防御来应对复杂的攻击。
排序理由 两篇学术论文发布在arXiv上,详细介绍了LLM鲁棒性和LVLM攻击的新方法。
- GPT-4o-mini
- Large Language Models
- Large Vision-Language Models
- Llama-3.2-Vision-11B-Instruct
- LLaVA-v1.6-Mistral-7B
- Multi-Turn Adaptive Prompting Attack
- Qwen2.5-VL-7B-Instruct
- Robustness of Prompting
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →