PulseAugur
实时 15:27:09
实体 LFM-2.5-350M

LFM-2.5-350M

PulseAugur coverage of LFM-2.5-350M — every cluster mentioning LFM-2.5-350M across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_52195 ·

    小型 LLM 通过分阶段训练实现受限摘要

    一位研究人员探索了小型语言模型(特别是 Qwen2.5-0.5B-Instruct 和 LFM-2.5-350M)的输出长度受限摘要。该项目研究了这些模型是否能在严格的 64 个 token 限制内生成高质量的 Reddit 帖子摘要。实验表明,分阶段的训练课程(首先关注长度惩罚,然后是质量奖励)优于联合训练,其中 METEOR 和 ROUGE-L 被证明是最有效的奖励组合。