English(EN) CreditDecoding: Accelerating Parallel Decoding in Diffusion Large Language Models with Trace Credit

新的 CreditDecoding 方法加速扩散 LLM 文本生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-27 04:00

研究人员开发了一种名为 CreditDecoding 的新方法，以加速扩散大型语言模型 (dLLM) 的文本生成过程。该技术解决了模型预测正确 token 的时间早于其解码置信度分数允许的时间的效率低下问题，导致冗余迭代。CreditDecoding 使用“Trace Credit”量化 token 的解码潜力，并将其与当前模型输出融合，以提高对正确但置信度不足的 token 的信心。这种无需训练的方法在各种基准测试和 dLLM 架构上都显示出高达 5.48 倍的显著加速，同时提高了准确性。 AI

影响加速 LLM 推理，可能为广泛的应用带来更快、更高效的文本生成。

排序理由这是一篇详细介绍加速 LLM 推理新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Kangyu Wang, Zhiyun Jiang, Haibo Feng, Weijia Zhao, Lin Liu, Jianguo Li, Zhenzhong Lan, Weiyao Lin · 2026-05-27 04:00

CreditDecoding：利用Trace Credit加速扩散大型语言模型的并行解码

arXiv:2510.06133v3 Announce Type: replace-cross Abstract: Diffusion large language models (dLLMs) generate text through iterative denoising. In commonly adopted parallel decoding schemes, each step confirms only high-confidence positions while remasking the others. By analyzing d…

报道来源 [1]

CreditDecoding：利用Trace Credit加速扩散大型语言模型的并行解码

相关实体

相关话题