研究人员引入了双焦扩散语言模型(dLLMs),以解决离散扩散模型中生成质量和推理速度之间的权衡问题。新的范例,以 R2LM(从右到左的 Mamba)为例,使用非对称双向上下文来实现高质量和高效的 KV 缓存。实验表明,R2LM 在吞吐量方面显著优于双向 dLLMs 和自回归基线,同时保持了具有竞争力的生成质量。 AI
影响 引入了一种新颖的架构,可在不牺牲生成质量的情况下显著提高扩散语言模型的推理速度。
排序理由 该集群包含一篇详细介绍新模型架构和实验结果的学术论文。
- arXiv
- Bifocal Diffusion Language Models
- DagsHub
- Hugging Face
- Mamba
- Qwen3 1.7B
- R2LM
- Right-to-Left Mamba
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →