研究人员引入了RobustMLLMJudge,一个旨在评估多模态大语言模型(MLLMs)在用作图像质量和安全评估等任务的裁判时的对抗鲁棒性的框架。研究发现,当前的MLLM裁判容易受到提高分数的攻击,并提出了一种名为流形引导语义归纳攻击(MGSIA)的新方法来创建更有效和可迁移的对抗性攻击。这凸显了开发更鲁棒的MLLM裁判以确保自动化评估系统可靠性的关键需求。 AI
影响 强调了对更鲁棒的AI裁判的需求,可能影响AI评估系统的开发和部署。
排序理由 该集群包含一篇学术论文,详细介绍了用于评估AI模型鲁棒性的新框架和攻击方法。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Hugging Face
- Manifold-Guided Semantic Induction Attack
- MGSIA
- Multimodal Large Language Models
- RobustMLLMJudge
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →