Apache TVM 推出了 TIRx,这是一个开源编译器堆栈,专为机器学习内核和不断发展的硬件而设计。这个新系统支持硬件原生 DSL,并可编译到 GPU 和专用 AI 加速器,同时注重适应未来硬件代际的灵活性。TIRx 旨在为程序员和机器之间提供一个灵活的边界,使专家能够控制底层操作,同时也支持常用任务的可重用块基元。 AI
影响 能够为多样化和不断发展的硬件架构更高效、更灵活地编译机器学习模型。
排序理由 该条目描述了一个用于 ML 内核的开源编译器堆栈的发布,这是 AI 基础设施领域的一项研发工作。
在 Mastodon — fosstodon.org 阅读 →
- Apache TVM
- Blackwell GPUs
- Carnegie Mellon University
- GitHub
- Python Package Index
- Triton
- AI accelerators
- ML Kernels
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →