研究人员开发了 RD-ViT,一种用于语义分割任务的新型循环深度视觉Transformer。该架构通过使用一个共享的、循环多次的Transformer块,显著降低了数据依赖性,这与需要为每一层使用独特参数的传统视觉Transformer不同。RD-ViT 结合了自适应计算时间和混合专家等技术来提高效率和专业化,在心脏MRI分割基准测试中,以更少的数据和更少的参数展示了改进的性能。 AI
影响 引入了一种更具数据效率的视觉Transformer方法,有可能降低在资源受限环境中部署分割模型的门槛。
排序理由 该集群包含一篇关于语义分割新模型架构的arXiv预印本。
- Adaptive Computation Time
- Google Colab
- LoRA
- Mixture-of-Experts
- RD-ViT
- Recurrent-Depth Transformer
- Vision Transformer
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →