实体
Yann Le Cun
Yann Le Cun
PulseAugur coverage of Yann Le Cun — every cluster mentioning Yann Le Cun across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
新架构实现世界模型近乎无限的时间一致性
一篇新研究论文介绍了一个物理基础符号架构(PGSA),它克服了当前统计世界模型的局限性。与需要高斯动力学来实现线性可辨识性和时间一致性的现有模型不同,PGSA 可以在所有物理状态下实现精确的线性可辨识性。这种新架构还提供了近乎无限的时间一致性,这意味着即使对于非高斯系统,其误差也仅受数值精度限制。
-
分析师称LLM参数增长表明侧重于记忆而非AGI
根据一项观察,以参数衡量的日益增大的大型语言模型可能表明其侧重于记忆而非真正的理解。这种方法受到投资压力的驱动,因为更大的模型可以制造出能力的假象,并通过硬件依赖提供竞争优势。实现AGI的真正进展可能涉及将更多数据输入到更小的模型中以鼓励更深入的学习,但当前的行业趋势倾向于庞大的参数数量,以确保硬件交易和投资者信心。
-
新的混合目标改进语言模型表示
研究人员为语言模型引入了一种新颖的自监督学习目标,该目标结合了掩码语言建模(MLM)和联合嵌入预测架构(JEPA)方法。这种混合方法旨在鼓励表示捕捉更深层次的语义结构,而不仅仅是表面标记的身份。在Wikipedia和GLUE基准上的实验表明,即使下游准确性指标相似,混合模型也能产生更均匀的嵌入和更好的语义-词汇平衡。