PulseAugur
实时 16:17:42
English(EN) Toward Compiler World Models: Learning Latent Dynamics for Efficient Tensor Program Search

新方法利用世界模型加速张量程序优化

研究人员开发了一种新颖的方法来优化机器学习系统的张量程序,将调度评估建模为潜在动态。这种受世界模型启发的 方法使用轻量级转换模型在连续潜在空间中预测程序状态,避免了昂贵的代码变异和编码。当在 TVM AutoScheduler 中实现时,与现有方法相比,它显著 降低了 GPU 和 CPU 上的子图延迟,并加速了全模型推理,所有这些都在减少的测量预算内完成。 AI

影响 这项研究通过优化底层张量计算,有望实现更高效的 AI 模型训练和推理。

排序理由 该集群包含一篇详细介绍新研究方法的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Haolin Pan, Lianghong Huang, Xvlin Zhou, Mingjie Xing, Yanjun Wu ·

    迈向编译器世界模型:学习潜在动态以实现高效张量程序搜索

    arXiv:2606.09312v1 Announce Type: new Abstract: Tensor program optimization is essential for modern machine learning systems, but its search space is enormous. Existing auto-schedulers reduce measurement cost with learned cost models, yet they usually evaluate each candidate as a…

  2. arXiv cs.LG TIER_1 English(EN) · Yanjun Wu ·

    迈向编译器世界模型:学习潜在动态以实现高效张量程序搜索

    Tensor program optimization is essential for modern machine learning systems, but its search space is enormous. Existing auto-schedulers reduce measurement cost with learned cost models, yet they usually evaluate each candidate as a static code snapshot, ignoring the schedule tra…