研究人员发布了 ASTRA-sim 3.0,这是一个用于分布式机器学习的更新的开源模拟器。新版本通过对 GPU 执行和基础设施进行细粒度、缓存线级别的建模,提高了模拟保真度。它还引入了 InfraGraph,一种用于网络基础设施的标准表示,能够对集合算法和硬件架构进行更详细的设计空间探索。 AI
影响 能够更准确地模拟分布式机器学习工作负载,从而可能加速高效的 AI 基础设施和算法的设计。
排序理由 这是一篇研究论文,详细介绍了用于分布式机器学习的更新模拟工具。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →