PulseAugur
实时 09:57:40
实体 KernelBench-X

KernelBench-X

PulseAugur coverage of KernelBench-X — every cluster mentioning KernelBench-X across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_20462 ·

    新基准测试揭示 LLM 生成的 GPU 内核在正确性和效率方面存在不足

    一项名为 KernelBench-X 的新基准测试已被开发出来,用于评估大型语言模型生成 GPU 内核的能力。该基准测试涵盖了 15 个类别中的 176 个任务,揭示了任务结构对正确性的影响比具体的生成方法更为显著。虽然迭代改进可以提高生成内核的编译率,但并不一定会提高其性能,而且许多正确的内核被发现比基线实现慢。