实体
ThunderKittens
ThunderKittens
PulseAugur coverage of ThunderKittens — every cluster mentioning ThunderKittens across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
斯坦福大学的ThunderKittens DSL优化AI内核性能
一篇新文章详细介绍了ThunderKittens,这是斯坦福大学Hazy Research Lab开发的一种紧凑型领域特定语言(DSL),用于创建高性能AI内核。该DSL旨在通过抽象重复的GPU编程任务(如切片布局和内存分配)来平衡研究生产力和硬件效率。这使得开发人员能够密切关注数据移动和调度,同时仍能优化现代AI工作负载在NVIDIA的Hopper和Blackwell等硬件上的性能。
-
Together AI 内核团队使用 FlashAttention 优化 GPU
Together AI 内核团队,包括研究员 Dan Fu 和 Tri Dao,开发了 FlashAttention,这是一个显著优化 AI 模型 GPU 性能的软件层。这项突破通过将数据库系统原理应用于 GPU 内存移动,实现了 2-3 倍的速度提升,挑战了 transformer attention 已经完全优化的观念。该团队后续的工作,包括 ThunderKittens 库,旨在加速 NVIDIA Blackwell GPU 等…