English(EN) Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

新的混合目标改进语言模型表示

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 04:00

研究人员为语言模型引入了一种新颖的自监督学习目标，该目标结合了掩码语言建模（MLM）和联合嵌入预测架构（JEPA）方法。这种混合方法旨在鼓励表示捕捉更深层次的语义结构，而不仅仅是表面标记的身份。在Wikipedia和GLUE基准上的实验表明，即使下游准确性指标相似，混合模型也能产生更均匀的嵌入和更好的语义-词汇平衡。 AI

影响这种混合目标可能带来更具语义鲁棒性的语言模型，提高需要更深层次理解的任务的性能。

排序理由该集群包含一篇学术论文，详细介绍了语言模型的新自监督学习目标。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Aimen Boukhari · 2026-06-05 04:00

预测与重构：自监督语言表示学习的联合目标

arXiv:2606.05173v1 Announce Type: new Abstract: Masked language modelling (MLM) has been the dominant pre-training objective for text encoders since BERT, yet it encourages representations that are strongly anchored to surface-form token identity rather than deeper semantic struc…

报道来源 [1]

预测与重构：自监督语言表示学习的联合目标

相关实体

相关话题