研究人员通过建立新的 Vision Transformer 基线,重新激活了 Apple Dense Material Segmentation (DMS) 基准。他们发现,由于高方差梯度,标准训练方法在处理无定形纹理时存在困难,从而开发了一种稳定的训练方法。这种新方法在原始数据集划分上取得了 0.4572 的最先进 mIoU,超越了之前的卷积模型。然而,该研究还揭示了一个“泛化悖论”,即数据丰富的划分虽然提高了指标,但却降低了实际性能,这凸显了物理基础 AI 面临的持续挑战。 AI
影响 为材料分割建立了新的 SOTA,并凸显了物理基础 AI 的关键泛化挑战。
排序理由 学术论文,介绍了一种用于计算机视觉任务的新模型基线和训练方法。
- Apple Dense Material Segmentation (DMS) dataset
- Mask2Former
- SegFormer
- Vision Transformers
- SegFormer-B5
- Vision Transformer
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →