PulseAugur
实时 10:00:37
实体 2/3/4b ish class model

2/3/4b ish class model

PulseAugur coverage of 2/3/4b ish class model — every cluster mentioning 2/3/4b ish class model across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_110435 ·

    新的采样器-验证器系统提高了小型LLM的编码性能

    一篇新的研究论文介绍了一个采样器和验证器系统,该系统显著提高了小型语言模型的编码性能。这种方法可以将一个拥有5亿参数的模型提升到20亿至40亿参数模型的水平,而无需更改其权重。该系统还旨在将大型模型的幻觉问题减少30-50%。然而,它会带来解码速度的损失,并且需要训练一个单独的验证器模型,这实际上使VRAM需求翻倍并增加了计算需求。