English(EN) BSViT: A Burst Spiking Vision Transformer for Expressive and Efficient Visual Representation Learning

BSViT引入突发脉冲，实现高效且富有表现力的视觉学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员推出了一种新颖的突发脉冲视觉Transformer（BSViT），旨在实现更高效、更具表现力的视觉表示学习。该新架构通过引入双通道突发脉冲自注意力机制来增强信息容量，解决了现有脉冲视觉Transformer的局限性。BSViT还采用了一种补丁邻近掩码策略，以降低计算负荷并提高空间感知能力，在各种视觉基准测试中表现出色，同时保持了能源效率。 AI

影响为神经形态硬件上的节能视觉学习引入了一种新架构。

排序理由这是一篇介绍计算机视觉新模型架构的研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Hongxiang Peng, Dewei Bai, Hong Qu · 2026-04-28 04:00

BSViT：用于富有表现力和高效视觉表示学习的爆发脉冲视觉Transformer

arXiv:2604.23165v1 Announce Type: new Abstract: Spiking Vision Transformers (S-ViTs) offer a promising framework for energy-efficient visual learning. However, existing designs remain limited by two fundamental issues: the restricted information capacity of binary spike coding an…

报道来源 [1]

BSViT：用于富有表现力和高效视觉表示学习的爆发脉冲视觉Transformer

相关实体

相关话题