PulseAugur
实时 09:52:46
实体 Blackwell Tensor Cores

Blackwell Tensor Cores

PulseAugur coverage of Blackwell Tensor Cores — every cluster mentioning Blackwell Tensor Cores across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_36662 ·

    NVIDIA 推出 LLM 的 4 位预训练方法 NVFP4

    NVIDIA 开发了一种新的 4 位预训练方法 NVFP4,旨在克服窄浮点格式中动态范围减小和量化误差增加的挑战。该方法通过在 10 万亿词元上预训练一个 120 亿参数的混合 Mamba-Transformer 模型得到了成功验证,标志着迄今为止公开记录的最长 4 位精度训练运行。在 MMLU-Pro 基准测试中,所得模型在性能上几乎与 FP8 基线相同,证明了 NVFP4 在大规模模型训练中的可行性。