NVIDIA 开发了一款名为 Star Elastic 的新 AI 模型,该模型将三种不同的模型尺寸(30B、23B 和 12B 参数)集成到一个检查点中。这种方法将训练成本和 token 使用量减少了 360 倍。该模型还承诺提高推理性能,有可能使其在消费级 GPU 上运行。 AI
影响 这种新颖的模型架构方法可以显著降低推理成本,并扩大先进 AI 功能的可及性。
排序理由 该集群描述了一种新的 AI 模型架构及其效率优势,属于研究范畴。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →