研究人员开发了 GF-DiT,一个新颖的运行时系统,旨在优化 Diffusion Transformers (DiTs) 的服务,DiTs 越来越多地用于图像和视频生成。与使用静态并行性的现有系统不同,GF-DiT 根据工作负载需求和服务目标动态调整 GPU 并行性。这是通过异步执行抽象和称为 group-free collectives 的通信抽象实现的,从而能够有效地在线重新分配 GPU 并减少通信开销。 AI
影响 这项研究可以显著提高 AI 驱动的图像和视频生成服务的效率并降低延迟。
排序理由 该集群描述了一篇关于优化 AI 模型服务的新颖系统的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →