实体
LLaDA-8B
LLaDA-8B
PulseAugur coverage of LLaDA-8B — every cluster mentioning LLaDA-8B across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新框架提升移动NPU上的端侧LLM推理性能
研究人员开发了一个名为“this http URL”的新框架,旨在优化移动设备上扩散大型语言模型(dLLMs)的推理。该框架解决了移动NPU架构固有的工作负载缩小和复杂数据管理等挑战。它采用了多块投机解码和双路径渐进式修订等技术,在保持输出质量的同时显著降低了生成延迟。
-
New CreditDecoding Method Accelerates Diffusion LLM Text Generation
Researchers have developed a new method called CreditDecoding to accelerate the text generation process in diffusion large language models (dLLMs). This technique addresses an inefficiency where models predict correct t…