研究人员开发了一种名为插入过程(IP)的新概率框架,用于处理可变长度序列的生成模型。与传统的从左到右模型不同,IP 允许以非固定顺序生成 token,学习何时插入以及何时终止。实验表明,这种方法在规划和分子字符串生成等任务中,尤其是在缺乏清晰顺序结构域中,可以提高建模质量和泛化能力。 AI
影响 引入了一种新颖的可变长度序列生成方法,有可能提高非顺序域中的建模质量和泛化能力。
排序理由 该集群包含一篇详细介绍新生成模型的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →