English(EN) SURGE: SuperBatch Unified Resource-efficient GPU Encoding for Heterogeneous Partitioned Data

SURGE 系统优化 GPU 编码以生成大规模文本嵌入

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了 SURGE，一个旨在提高 GPU 上文本嵌入生成效率的新系统。SURGE 通过采用流式 SuperBatch 方法解决了处理大量小数据分区的瓶颈问题，与传统的固定批次方法相比，显著降低了内存使用量并加快了首次输出时间。该系统已投入生产使用，处理了超过 8 亿条文本，在内存需求显著降低的情况下，首次输出时间快了 68 倍。 AI

影响该系统有望提高大规模 AI 应用的嵌入生成管道的效率和可扩展性。

排序理由该集群包含一篇 arXiv 预印本论文，详细介绍了一个新的 GPU 编码系统。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Shashank Kapadia, Deep Narayan Mishra, Sujal Reddy Alugubelli, Ajay Kumar, Swapnil Yadav, Rishi Bhatia · 2026-05-05 04:00

SURGE：异构分区数据的超级批次统一资源高效GPU编码

arXiv:2605.01060v1 Announce Type: cross Abstract: We present SURGE, a streaming GPU encoding system deployed in production to generate embeddings for over 800 million texts across 40,000 logical partitions. Production embedding pipelines face a tension between logical data partit…

报道来源 [1]

SURGE：异构分区数据的超级批次统一资源高效GPU编码

相关实体

相关话题