研究人员开发了一种名为 CUDA 感知指令调优 (CuSeT) 的新方法,以改进大型语言模型生成 CUDA 核。该技术解决了 CUDA 代码中隐式执行约束的挑战,而现有方法难以有效建模。CuSeT 基于“从 Token 到 Region”的原理,结合自适应 Token 级掩码和区域感知样本重加权,以增强功能正确性。实验表明,CuSeT 的性能优于标准和高级监督微调方法,以更低的推理成本取得了有竞争力的结果。 AI
影响 这项研究通过改进专用 GPU 代码的生成,有望带来更高效、更准确的 AI 系统。
排序理由 该集群包含一篇详细介绍改进 AI 模型能力新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →