PulseAugur
实时 10:53:53
English(EN) MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore Threads GPU

MusaCoder 实现最先进的GPU内核生成

研究人员开发了MusaCoder,一个用于生成原生GPU内核的新颖框架,这对于高效的底层代码执行至关重要。该系统采用全栈训练方法,结合了数据合成、强化学习和一个名为MooreEval的分布式验证环境。与现有模型相比,MusaCoder在正确性和加速方面表现出卓越的性能,其更大版本在原生GPU内核生成方面设定了新的最先进水平。 AI

影响 为原生GPU内核生成树立了新的最先进水平,有可能加速在专用硬件上的人工智能开发。

排序理由 该集群包含一篇研究论文,详细介绍了一个用于特定AI任务的新模型和训练框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Kun Cheng, Songshuo Lu, Sicong Liao, Tankun Li, Yafei Zhang, Dong Yang, Qiheng Lv, Hua Wang, Zhi Chen, Yaohua Tang ·

    MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore Threads GPU

    arXiv:2606.04847v1 Announce Type: cross Abstract: Native GPU kernel generation turns high-level tensor programs into executable, efficient low-level code. Existing Large Language Models (LLMs) struggle with this task, while execution-based reinforcement learning suffers from spar…