PulseAugur
实时 12:43:40

BlockGen 模型探索使用混合采样器进行分块序列生成

研究人员推出了一种新颖的分块序列建模方法 BlockGen,该方法利用混合采样器进行离散扩散。该方法比较了统一状态扩散模型 (USDMs) 与掩码扩散模型 (MDMs) 在分块生成序列(而非逐个 token 生成)时的有效性。BlockGen 将自回归 (AR) 预测与扩散模型相结合,以优化不太可能的 token,在 GSM8KOpenWebText 等任务上表现出竞争力。 AI

影响 引入了一种新的分块序列生成方法,有望提高离散扩散模型的效率和性能。

排序理由 该集群包含一篇详细介绍新建模方法的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Justin Deschenaux, Caglar Gulcehre ·

    BlockGen: Flexible Blockwise Sequence Modeling with Hybrid Samplers

    arXiv:2606.02241v1 Announce Type: new Abstract: Is the uniform-state diffusion framework a more powerful paradigm for discrete diffusion? Recent studies indicate that this may be the case. In combination with predictor-corrector samplers, uniform-state diffusion models (USDMs) pr…

  2. arXiv cs.LG TIER_1 English(EN) · Caglar Gulcehre ·

    BlockGen: Flexible Blockwise Sequence Modeling with Hybrid Samplers

    Is the uniform-state diffusion framework a more powerful paradigm for discrete diffusion? Recent studies indicate that this may be the case. In combination with predictor-corrector samplers, uniform-state diffusion models (USDMs) produce samples of higher-quality than masked diff…