New Vision Transformer baseline sets SOTA on material segmentation

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-22 15:20

研究人员通过建立新的 Vision Transformer 基线，重新激活了 Apple Dense Material Segmentation (DMS) 基准。他们发现，由于高方差梯度，标准训练方法在处理无定形纹理时存在困难，从而开发了一种稳定的训练方法。这种新方法在原始数据集划分上取得了 0.4572 的最先进 mIoU，超越了之前的卷积模型。然而，该研究还揭示了一个“泛化悖论”，即数据丰富的划分虽然提高了指标，但却降低了实际性能，这凸显了物理基础 AI 面临的持续挑战。 AI

影响为材料分割建立了新的 SOTA，并凸显了物理基础 AI 的关键泛化挑战。

排序理由学术论文，介绍了一种用于计算机视觉任务的新模型基线和训练方法。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

New Vision Transformer baseline sets SOTA on material segmentation

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Allan Kazakov, Duygu Cakir, Hilal Kurt \.Irfano\u{g}lu, Yavuz \.Irfano\u{g}lu · 2026-05-25 04:00

Revitalizing Dense Material Segmentation: Stabilized Vision Transformers and the Generalization Paradox

arXiv:2605.23747v1 Announce Type: new Abstract: Material segmentation, the pixel-wise classification of physical surface properties, remains a challenging problem in computer vision, requiring physicochemical understanding distinct from object-centric parsing. Despite the introdu…
arXiv cs.CV TIER_1 English(EN) · Yavuz İrfanoğlu · 2026-05-22 15:20

Revitalizing Dense Material Segmentation: Stabilized Vision Transformers and the Generalization Paradox

Material segmentation, the pixel-wise classification of physical surface properties, remains a challenging problem in computer vision, requiring physicochemical understanding distinct from object-centric parsing. Despite the introduction of the rigorous Apple Dense Material Segme…

报道来源 [2]

Revitalizing Dense Material Segmentation: Stabilized Vision Transformers and the Generalization Paradox

Revitalizing Dense Material Segmentation: Stabilized Vision Transformers and the Generalization Paradox

相关实体

相关话题