PulseAugur
实时 13:14:54
实体 Prosper

Prosper

PulseAugur coverage of Prosper — every cluster mentioning Prosper across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_20553 ·

    新的PROSPER算法解决了大型语言模型微调中的不传递偏好问题

    研究人员开发了一种名为最大熵Blackwell获胜者(MaxEntBW)的新方法,以解决大型语言模型多目标微调中的不传递偏好问题。该方法在PROSPER算法中实现,可以直接处理多个目标,而无需将它们合并为单一指标。实验表明,PROSPER在指令遵循和聊天基准测试中优于现有方法,并发布了7B和3B参数规模的训练模型检查点。