PulseAugur
实时 12:33:58
实体 SMS-EMOA: Multiobjective selection based on dominated hypervolume

SMS-EMOA: Multiobjective selection based on dominated hypervolume

PulseAugur coverage of SMS-EMOA: Multiobjective selection based on dominated hypervolume — every cluster mentioning SMS-EMOA: Multiobjective selection based on dominated hypervolume across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_27578 ·

    EvoPref算法通过进化优化增强语言模型对齐

    研究人员开发了EvoPref,这是一种新颖的多目标进化算法,旨在改进大型语言模型(LLM)的对齐。与可能导致偏好崩溃和狭窄行为模式的传统基于梯度的方法不同,EvoPref维护了针对有用性、无害性和诚实性进行优化的适配器多样化种群。这种方法显著增强了偏好覆盖范围并降低了崩溃率,同时实现了具有竞争力的对齐质量,确立了进化优化作为多样化LLM对齐的可行范式。