研究人员推出了一种新颖的视觉架构 PRISM,该架构通过迭代地精炼图像表示来模仿人类感知。这种金字塔架构对视觉特征进行分组,从记忆中检索模式,并对其进行精炼以解决歧义和恢复缺失信息。PRISM 在标准视觉任务上表现出具有竞争力的性能,并提高了对遮挡的鲁棒性,表明具有记忆的迭代推理是弹性视觉模型的关键。 AI
影响 为视觉模型引入了一种新的架构方法,可以提高在不完整数据任务上的鲁棒性和性能。
排序理由 介绍新模型架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →