PulseAugur
实时 03:51:32

Together AI 发布 ParallelKernelBench 以测试 LLM 多 GPU 内核生成

Together AI 推出了 ParallelKernelBench,这是一个开源基准测试,旨在评估大型语言模型为多 GPU 系统生成高效 CUDA 内核的能力。该基准测试侧重于评估前沿 LLM 在处理复杂、通信密集型工作负载方面的能力,这对于高性能计算至关重要。此次发布凸显了在优化 LLM 以适应专业化、低级编程任务方面持续存在的挑战。 AI

影响 该基准测试将帮助开发人员评估和改进 LLM 在为多 GPU 系统生成低级、高性能代码方面的性能。

排序理由 开源基准测试发布,用于评估 LLM 能力。

在 X — Together (inference / OSS) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Together AI 发布 ParallelKernelBench 以测试 LLM 多 GPU 内核生成

报道来源 [2]

  1. X — Together (inference / OSS) TIER_1 English(EN) · togethercompute ·

    在 ParallelKernelBench 上阅读更多:https://t.co/MtQY3lMtcB

    Read more on ParallelKernelBench: https://t.co/MtQY3lMtcB

  2. X — Together (inference / OSS) TIER_1 English(EN) · togethercompute ·

    多 GPU 内核是代码模型的真正考验。今天在 @aiDotEngineer,@simran_s_arora 分享了 ParallelKernelBench,一个用于评估的开源基准测试

    Multi-GPU kernels are the real test for coding models. Today at @aiDotEngineer, @simran_s_arora shared ParallelKernelBench, an open-source benchmark for evaluating whether LLMs can write fast CUDA kernels for real communication-heavy workloads. Proud to see this work from h…