PulseAugur
实时 12:54:13
English(EN) HASTE: Hardware-Aware Dynamic Sparse Training for Large Output Spaces

HASTE 方法优化极端多标签分类模型

研究人员开发了 HASTE,一种用于优化极端多标签分类 (XMC) 模型的新颖方法。HASTE 通过引入组共享固定扇入稀疏性来解决 XMC 中的瓶颈,该稀疏性允许语义相关的标签共享稀疏输入模式。这种方法通过定制的 CUDA 核增强了硬件利用率并实现了高效的 GPU 执行,与现有的稀疏方法相比,在前向和后向传播中实现了显著的加速。 AI

影响 引入了一种新技术,以提高极端多标签分类任务的效率和性能。

排序理由 该集群包含一篇详细介绍优化机器学习模型新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Nasib Ullah, Jinbin Zhang, Jean Lucien Randrianantenaina, Erik Schultheis, Rohit Babbar ·

    HASTE: Hardware-Aware Dynamic Sparse Training for Large Output Spaces

    arXiv:2606.01117v1 Announce Type: cross Abstract: Extreme multi-label classification (XMC) involves learning models over large output spaces with millions of labels, making the output layer a memory-compute bottleneck. While sparsity-based methods reduce arithmetic complexity, th…