研究人员开发了 Lighthouse Attention,这是一种新的仅用于训练的机制,旨在显著加速大型语言模型的预训练,特别是处理长序列的模型。据称,这种分层方法可将 AI 训练时间减少高达 70%,并将速度提高 1.7 倍。该方法由 Nous Research 开发,旨在提高效率而不损害模型质量。 AI
影响 这种新的训练机制可以显著降低训练大型语言模型所需的成本和时间,从而可能加速开发和部署。
排序理由 该集群描述了研究人员发布的一种用于 AI 训练的新算法方法。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →