实体 CUDA Kernels

CUDA Kernels

PulseAugur coverage of CUDA Kernels — every cluster mentioning CUDA Kernels across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_91397 · Jun 15 · 04:00

全新 7B 统一扩散语言模型 'Sumi' 发布，伴随扩散模型进展

研究人员推出了 Sumi，一个拥有 70 亿参数的统一扩散语言模型 (UDLM)，该模型在 1.5 万亿 tokens 上从头开始预训练。这个开源模型在知识、推理和编码任务上表现出与自回归模型相当的性能，但在常识基准测试上表现稍逊。发布内容包括模型权重、检查点以及完整的训练方法，旨在为大规模研究 UDLM 提供参考。此外，其他研究探索了扩散语言模型的进展，包括生成 CUDA 核的方法、通过自生成错误训练改进 Token 编辑，以及开发…
RESEARCH · CL_26186 · May 11 · 08:36

Sakana AI、NVIDIA 发布 TwELL，加速 LLM 训练和推理

Sakana AI 和 NVIDIA 的研究人员开发了 TwELL，这是一种显著加速大型语言模型 (LLM) 操作的新方法。通过针对计算密集型的前馈层，TwELL 实现了高稀疏性，并在 GPU 上转化为实际性能提升。该方法在不影响模型准确性的情况下，训练速度最高提升 21.9%，推理速度最高提升 20.5%。