研究人员推出了一种名为PhaseWin的新型算法,旨在提高解释视觉和视觉-语言模型的可视归因方法的效率和忠实度。与需要大量模型评估的现有贪婪方法不同,PhaseWin采用分阶段窗口搜索策略。该方法在全局筛选、剪枝和局部精炼之间交替进行,以实现线性评估复杂性,同时保持接近贪婪的忠实度。在图像分类和字幕生成等各种任务上的实验表明,与其它归因技术相比,PhaseWin能够以显著减少的前向传播次数达到高忠实度。 AI
影响 PhaseWin为解释AI模型提供了一种更有效的方法,有望加速调试和审计过程。
排序理由 该集群包含一篇详细介绍AI模型解释新算法的研究论文。
- arXiv
- cs.CV
- Hugging Face
- image captioning
- image classification
- object detection
- PhaseWin
- vision-language model
- Visual Grounding with Multi-modal Conditional Adaptation
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →