研究人员推出了一种用于扩散大型语言模型 (dLLMs) 的新型调度方法——动态滑动块 (DSB),旨在同时提高生成质量和推理效率。与固定的块调度不同,DSB 根据语义难度动态调整块大小,防止过早承诺并优化处理时间。该方法还包含 DSB Cache,一种补充性的 KV 缓存机制,旨在通过 DSB 进一步提高效率。实验表明,这种方法在各种模型和基准测试中始终能产生更好的结果。 AI
影响 这项研究可能导致扩散 LLMs 生成更高效、更高质量的文本,从而影响需要高级语言能力的应用程序。
排序理由 该集群描述了 arXiv 论文中提出的一种用于扩散 LLMs 的新方法和缓存机制。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- Diffusion LLMs
- DSB
- DSB Cache
- Gotit.pub
- Hugging Face
- Lizhuo Luo
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →