English(EN) DSB: Dynamic Sliding Block Scheduling for Diffusion LLMs

新的 DSB 方法优化扩散 LLM 调度，以提高质量和效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 04:00

研究人员推出了一种用于扩散大型语言模型 (dLLMs) 的新型调度方法——动态滑动块 (DSB)，旨在同时提高生成质量和推理效率。与固定的块调度不同，DSB 根据语义难度动态调整块大小，防止过早承诺并优化处理时间。该方法还包含 DSB Cache，一种补充性的 KV 缓存机制，旨在通过 DSB 进一步提高效率。实验表明，这种方法在各种模型和基准测试中始终能产生更好的结果。 AI

影响这项研究可能导致扩散 LLMs 生成更高效、更高质量的文本，从而影响需要高级语言能力的应用程序。

排序理由该集群描述了 arXiv 论文中提出的一种用于扩散 LLMs 的新方法和缓存机制。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Lizhuo Luo, Shenggui Li, Yonggang Wen, Tianwei Zhang · 2026-06-18 04:00

DSB: Dynamic Sliding Block Scheduling for Diffusion LLMs

arXiv:2602.05992v3 Announce Type: replace Abstract: Diffusion large language models (dLLMs) have emerged as a promising alternative for text generation, distinguished by their native support for parallel decoding. In practice, block inference is crucial for avoiding order misalig…

报道来源 [1]

DSB: Dynamic Sliding Block Scheduling for Diffusion LLMs

相关实体

相关话题