PulseAugur
实时 05:36:47
实体 Discriminative Reward Scaling

Discriminative Reward Scaling

PulseAugur coverage of Discriminative Reward Scaling — every cluster mentioning Discriminative Reward Scaling across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_111295 ·

    新的DyRef框架增强了多参考图像生成能力

    研究人员引入了DyRef,一个新颖的两阶段训练框架,旨在改进多参考图像生成(MRIG)。该框架解决了现有基准和模型在处理具有众多混合类型参考图像的复杂MRIG场景时的局限性。DyRef结合了难度感知优势重加权(DAR)和判别性奖励缩放(DRS)来动态优化性能并增强策略优化,在新的OmniRef-Bench和单图像编辑任务上显示出显著的改进。