一位开发者创建了Picotron,一个专为在旧款GPU上运行而不崩溃而设计的LLM训练框架。该框架消除了强制性的GPU特定依赖,使其能在任何支持PyTorch的GPU上运行。Picotron默认使用标准的PyTorch SDPA,但如果可用,也可以利用FlashAttention-2,并包含各种注意力机制和优化技术的配置。 AI
影响 通过降低硬件要求,使LLM训练的普及范围更广。
排序理由 该集群描述了一个用于LLM训练的新软件工具,而不是前沿模型发布或重要的行业事件。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →