实体
NVIDIA HGX B200
NVIDIA HGX B200
PulseAugur coverage of NVIDIA HGX B200 — every cluster mentioning NVIDIA HGX B200 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
DeepSeek-V4 的 100 万 token 上下文窗口是一个推理系统挑战
Together AI 详细介绍了 DeepSeek-V4 处理一百万 token 上下文窗口的能力背后的架构创新。该模型采用混合注意力设计,在将上下文压缩后存储在 KV 缓存中,显著降低了内存压力。这种架构转变将长上下文推理的挑战从模型能力问题转变为推理系统问题,需要优化的服务引擎来有效管理缓存布局和批处理。
-
Together AI 借助 NVIDIA Blackwell 将 AI 训练速度提升 90%
Together AI 推出了采用 NVIDIA Blackwell 平台的新 GPU 集群,显著加快了 AI 训练和推理速度。这些集群由 Together Kernel Collection 提供支持,与之前的 NVIDIA H100 硬件相比,训练速度最高可提高 90%,处理大型模型的速度超过每秒 15,000 个 token。Salesforce 和 Zoom 等早期客户已报告了显著的性能提升,其中一些客户的训练速度翻倍。Tog…