研究人员开发了一种新颖的方法来优化机器学习系统的张量程序,将调度评估建模为潜在动态。这种受世界模型启发的 方法使用轻量级转换模型在连续潜在空间中预测程序状态,避免了昂贵的代码变异和编码。当在 TVM AutoScheduler 中实现时,与现有方法相比,它显著 降低了 GPU 和 CPU 上的子图延迟,并加速了全模型推理,所有这些都在减少的测量预算内完成。 AI
影响 这项研究通过优化底层张量计算,有望实现更高效的 AI 模型训练和推理。
排序理由 该集群包含一篇详细介绍新研究方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →