English(EN) HASTE: Hardware-Aware Dynamic Sparse Training for Large Output Spaces

HASTE 方法优化极端多标签分类模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了 HASTE，一种用于优化极端多标签分类 (XMC) 模型的新颖方法。HASTE 通过引入组共享固定扇入稀疏性来解决 XMC 中的瓶颈，该稀疏性允许语义相关的标签共享稀疏输入模式。这种方法通过定制的 CUDA 核增强了硬件利用率并实现了高效的 GPU 执行，与现有的稀疏方法相比，在前向和后向传播中实现了显著的加速。 AI

影响引入了一种新技术，以提高极端多标签分类任务的效率和性能。

排序理由该集群包含一篇详细介绍优化机器学习模型新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Nasib Ullah, Jinbin Zhang, Jean Lucien Randrianantenaina, Erik Schultheis, Rohit Babbar · 2026-06-02 04:00

HASTE: 面向大规模输出空间的硬件感知动态稀疏训练

arXiv:2606.01117v1 Announce Type: cross Abstract: Extreme multi-label classification (XMC) involves learning models over large output spaces with millions of labels, making the output layer a memory-compute bottleneck. While sparsity-based methods reduce arithmetic complexity, th…

报道来源 [1]

HASTE: 面向大规模输出空间的硬件感知动态稀疏训练

相关实体

相关话题