研究人员开发了LC4-DViT,一个使用可变形视觉Transformer进行土地覆盖分类的新型框架。该方法结合了生成式数据创建和一种感知变形的骨干网络,以提高准确性并处理高分辨率图像中的几何畸变。该系统使用GPT-4o生成的描述合成类别平衡的训练图像,并在基准数据集上取得了最先进的结果,展示了强大的迁移能力和与相关结构改进的注意力对齐。 AI
影响 通过结合生成式AI和专门的视觉Transformer,为高分辨率土地覆盖测绘引入了一种新颖的方法。
排序理由 介绍用于土地覆盖分类的新框架和模型架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- AID-Beach
- DCNv4
- Deformable Vision Transformer
- FlashInternImage
- GPT-4o
- Kai Wang
- LC4-DViT
- MobileNetV2
- ResNet50
- SIRI-WHU
- Vision Transformer
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →