实体
ViT-Up
ViT-Up
PulseAugur coverage of ViT-Up — every cluster mentioning ViT-Up across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
ViT-Up 框架增强 Vision Transformer 特征上采样
研究人员开发了 ViT-Up,一个用于改进 Vision Transformer (ViTs) 中特征上采样的新框架。与依赖外部图像引导的先前方法不同,ViT-Up 使用中间 ViT 隐藏状态来构建查询,从而能够在任意坐标处进行特征预测,同时保持与骨干特征的对齐。这种方法旨在克服 ViTs 在密集预测任务中因在大网格上计算成本高而带来的局限性。
-
ViT-Up 框架增强 Vision Transformer 特征上采样
研究人员推出了一种名为 ViT-Up 的新颖框架,旨在增强 Vision Transformer (ViTs) 的特征上采样。该方法利用中间隐藏状态进行逐层查询构建,无需外部图像引导,从而避免了特征泄露和碎片化等问题。ViT-Up 能够预测任意连续图像坐标处的特征,从而在语义分割和深度估计等密集预测任务上获得更好的性能,并在 Cityscapes 和 SPair-71k 等基准测试中取得了显著的提升。