Yann LeCun 正在开发一种新颖的 AI 模型架构,旨在实现极高的效率。该新模型仅拥有 1500 万个参数,可在几小时内在单个 GPU 上进行训练。该方法包含两个关键概念:用于学习紧凑世界模型的联合嵌入预测架构 (JEPA) 和用于稳定且可扩展的潜在空间训练的草图各向同性高斯正则化器 (SIGReg)。 AI
影响 这项研究可能会显著降低 AI 模型训练和开发的门槛,从而实现更易于访问的实验。
排序理由 该集群描述了一种新的 AI 模型架构及其底层概念,这是一项研究进展。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →