PulseAugur
实时 04:43:47
实体 Next-Latent Prediction (NextLat)

Next-Latent Prediction (NextLat)

PulseAugur coverage of Next-Latent Prediction (NextLat) — every cluster mentioning Next-Latent Prediction (NextLat) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_48970 ·

    NextLat Transformers 学习紧凑的世界模型以实现更好的泛化

    研究人员开发了一种名为 Next-Latent Prediction (NextLat) 的新训练方法,用于 transformer 模型,鼓励它们构建更紧凑的内部世界模型。该方法在标准的下一个 token 预测基础上增加了一个自监督目标,训练 transformer 根据当前 token 预测其未来的潜在状态。该方法在包括语言建模在内的各种基准测试中,在准确性、表示压缩和规划方面都显示出实证收益,并且还能加速推理。