PulseAugur
实时 10:24:47
实体 RTDMD

RTDMD

PulseAugur coverage of RTDMD — every cluster mentioning RTDMD across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_50750 ·

    新框架增强文本到图像模型与人类偏好的对齐

    研究人员开发了两个新颖的框架,DIDR和RTDMD,以改进文本到图像生成模型与人类偏好的对齐。DIDR(Diff-Instruct with Diffused Reward)是一个无数据框架,可在扩散轨迹的所有噪声水平上优化奖励,从而提高图像保真度。RTDMD是一种两阶段方法,将分布匹配蒸馏与奖励引导的强化学习相结合,用于少步生成器。这两种方法在偏好、美学和构图指标方面都显示出显著的改进,其中RTDMD仅用几步推理即可在SD3、SD3…