PulseAugur
实时 16:18:31
实体 MLM-head

MLM-head

PulseAugur coverage of MLM-head — every cluster mentioning MLM-head across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_97776 ·

    新技术改进了具有更大编码器的SPLADE检索模型

    研究人员发现,在使用更大的、更强大的预训练编码器时,SPLADE(一种神经稀疏检索模型)会出现性能下降的问题。这个问题被称为MLM头中的“尺度不匹配”,可能导致训练不稳定甚至崩溃。研究人员提出了一种简单的、零成本的调整方法,即在训练前重新调整MLM头的投影,这显著提高了ModernBERT和Ettin等模型的稳定性和检索效果。这种修正使得这些更大的骨干模型能够匹配甚至超越经典的BERT-SPLADE基线的性能。