Together AI 推出了 ParallelKernelBench,这是一个开源基准测试,旨在评估大型语言模型为多 GPU 系统生成高效 CUDA 内核的能力。该基准测试侧重于评估前沿 LLM 在处理复杂、通信密集型工作负载方面的能力,这对于高性能计算至关重要。此次发布凸显了在优化 LLM 以适应专业化、低级编程任务方面持续存在的挑战。 AI
影响 该基准测试将帮助开发人员评估和改进 LLM 在为多 GPU 系统生成低级、高性能代码方面的性能。
排序理由 开源基准测试发布,用于评估 LLM 能力。
在 X — Together (inference / OSS) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →