研究人员引入了测试时蒸馏(TTD),这是一种新颖的方法,用于解决深度神经网络在部署过程中由于分布变化而导致的性能下降问题。现有方法经常会放大预测错误,导致模型漂移。TTD将适应重构为蒸馏过程,使用一个固定的视觉语言模型(VLM)作为外部指导信号。为了克服“通才陷阱”和“熵偏差”等挑战,该团队开发了CoDiRe框架,该框架构建了一个鲁棒的混合教师模型,并使用最优传输进行校正,从而实现稳定的适应。 AI
影响 引入了一个新框架,用于提高模型在分布变化方面的鲁棒性,有可能提升现实世界中的AI性能。
排序理由 这是一篇介绍模型适应新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →