PulseAugur
实时 22:05:38
实体 SlideFormer

SlideFormer

PulseAugur coverage of SlideFormer — every cluster mentioning SlideFormer across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_119590 ·

    新系统支持在单 GPU 上微调 123B+ LLM

    研究人员开发了 SlideFormer,一个旨在实现大型语言模型(LLM)在单 GPU 上微调的新颖系统。该系统利用一个轻量级的异步引擎,将 GPU 视为一个滑动窗口,将计算与 CPU 更新和 I/O 重叠。它还包含一个高效的异构内存管理方案和优化的 Triton 内核,以减少峰值内存使用量。这种方法允许在单个 RTX 4090 上微调超过 1230 亿参数的模型,支持显著更大的批次大小和模型,同时提高吞吐量并减少内存消耗。