PulseAugur
实时 10:43:54
实体 Diffusion Large Language Models

Diffusion Large Language Models

PulseAugur coverage of Diffusion Large Language Models — every cluster mentioning Diffusion Large Language Models across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_27591 ·

    TAD框架提升扩散大语言模型的速度和准确性

    研究人员推出了一种名为TAD(时序感知轨迹自蒸馏)的框架,旨在提高扩散大语言模型(dLLMs)的速度和准确性。TAD通过使用教师模型生成解码轨迹来解决文本生成速度越快质量越低的常见权衡问题。然后,它根据token的时间接近度,使用不同的损失函数来训练学生模型,鼓励对近距离token进行自信预测,并为远距离token保留未来规划知识。在LLaDA上的实验表明,在准确性和加速方面都有显著的改进。