PulseAugur
实时 09:16:17
实体 Infinite Mask Diffusion Model

Infinite Mask Diffusion Model

PulseAugur coverage of Infinite Mask Diffusion Model — every cluster mentioning Infinite Mask Diffusion Model across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_28293 ·

    新的大语言模型训练方法提高了效率和错误恢复能力

    研究人员开发了提高大语言模型(LLM)训练效率的新技术。一种名为“步进拒绝微调”(SRFT)的方法,通过评估每个步骤的正确性来利用不成功的训练轨迹,使模型能够在不重复错误的情况下从中学习。该方法将SWE-bench任务的解决率提高了3.7%。另一项开发,“无限掩码扩散模型”(IMDM),通过引入随机无限状态掩码来解决掩码扩散模型(MDMs)中的因子化错误。IMDM展示了卓越的几步生成能力,并在与蒸馏结合时,在LM1B和OpenWebT…