PulseAugur
实时 06:23:50
English(EN) Flash-GMM: A Memory-Efficient Kernel for Scalable Soft Clustering

Flash-GMM 内核将 GMM 聚类速度提升 20 倍,适用于大型数据集

研究人员开发了 Flash-GMM,这是一种专为大型数据集上的高斯混合模型 (GMM) 高效计算而设计的新型内核。该内核通过避免完全物化责任矩阵,显著降低了内存需求,实现了 20 倍的速度提升,并使得在单个 GPU 上训练的数据集大小是以前可能大小的 100 倍。Flash-GMM 已集成到近似最近邻搜索中,为 k-means 提供了一种可行的替代方案,并提高了召回率。 AI

影响 能够对大型数据集进行更高效、更具可扩展性的聚类,有可能提高近似最近邻搜索等领域的性能。

排序理由 这是一篇详细介绍机器学习算法新计算内核的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Assaf Toledo ·

    Flash-GMM:一种内存高效的内核,用于可扩展的软聚类

    We present \textbf{Flash-GMM}, a fused Triton kernel for efficient computation of Gaussian Mixture Models (GMMs) over large-scale data in a single GPU pass. By eliminating the need to materialize the full responsibility matrix in GPU memory, Flash-GMM achieves a \textbf{20$\times…