实体
Tri Dao
Tri Dao
PulseAugur coverage of Tri Dao — every cluster mentioning Tri Dao across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
Together AI 内核团队使用 FlashAttention 优化 GPU
Together AI 内核团队,包括研究员 Dan Fu 和 Tri Dao,开发了 FlashAttention,这是一个显著优化 AI 模型 GPU 性能的软件层。这项突破通过将数据库系统原理应用于 GPU 内存移动,实现了 2-3 倍的速度提升,挑战了 transformer attention 已经完全优化的观念。该团队后续的工作,包括 ThunderKittens 库,旨在加速 NVIDIA Blackwell GPU 等…
-
Together AI 借助 NVIDIA Blackwell 将 AI 训练速度提升 90%
Together AI 推出了采用 NVIDIA Blackwell 平台的新 GPU 集群,显著加快了 AI 训练和推理速度。这些集群由 Together Kernel Collection 提供支持,与之前的 NVIDIA H100 硬件相比,训练速度最高可提高 90%,处理大型模型的速度超过每秒 15,000 个 token。Salesforce 和 Zoom 等早期客户已报告了显著的性能提升,其中一些客户的训练速度翻倍。Tog…