English(EN) Linearizing Vision Transformer with Test-Time Training

视觉Transformer线性化，通过TTT实现更快的推理速度

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 00:00

研究人员开发了一种方法，将预训练的视觉Transformer模型转换为线性复杂度的测试时训练（TTT）架构。该方法对齐了架构和表示属性，允许从Softmax注意力模型高效地迁移权重。通过将此方法应用于Stable Diffusion 3.5，他们创建了SD3.5-T^5，该模型在经过少量微调后，实现了相当的图像质量和显著更快的推理速度。 AI

影响通过调整现有架构，实现大型视觉模型更快的推理速度。

排序理由该集群包含一篇研究论文，详细介绍了一种新的模型转换方法及其产生的模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-28 00:00

使用测试时训练线性化 Vision Transformer

Researchers develop a method to convert pretrained Softmax attention models to linear-complexity Test-Time Training architectures through architectural and representational alignment, achieving fast inference with minimal fine-tuning.

报道来源 [1]

使用测试时训练线性化 Vision Transformer

相关实体

相关话题