NVIDIA H200
PulseAugur coverage of NVIDIA H200 — every cluster mentioning NVIDIA H200 across labs, papers, and developer communities, ranked by signal.
3 天有情绪数据
-
Together AI 增加 1,000 块 H100/H200 GPU 用于推理
Together AI 通过增加一千台 NVIDIA H100 和 H200 实例,显著扩展了其 GPU 容量。这些强大的 GPU 现已通过 Together 的按需 GPU 集群和专用端点服务提供。此次扩展旨在为 AI 推理和开源模型开发提供更强大的基础设施。
-
AIGaitor 通过智能手机实现设备端、私密的运动分析
研究人员开发了 AIGaitor,一个全新的运动分析系统,该系统完全在智能手机上运行,无需云端处理。这种方法解决了康复临床医生提出的、在临床运动捕捉中存在的成本、复杂性和隐私问题等关键障碍。AIGaitor 利用设备端的神经网络加速器执行无标记单目运动捕捉和深度学习分析,处理速度可与云端系统相媲美。
-
Hugging Face and AWS Detail Foundation Model Infrastructure
Hugging Face and AWS have collaborated to detail the infrastructure required for training and running large foundation models. The blog post outlines a layered architecture, emphasizing the interplay between AWS's compu…
-
Hallo-Live 实现 20 FPS 的实时音视频化身生成
研究人员开发了 Hallo-Live,一个用于实时文本驱动音视频化身生成的新颖框架。该系统利用异步双流扩散方法结合以人为本的偏好蒸馏,以实现高保真度和同步性。Hallo-Live 展现了显著的速度提升,以 20.38 FPS 的低延迟运行,使其适用于交互式应用。
-
DeepSeek v3 引领开源模型,Baseten 实现任务关键型推理
DeepSeek v3 是一款新的 6710 亿参数的混合专家模型,现已发布,是目前性能最佳的开源模型。服务如此大的模型带来了巨大的挑战,但推理初创公司 Baseten 已成功部署了 DeepSeek v3,使用了 NVIDIA H200 GPU 和 SGLang 框架。此次部署强调了大规模运行任务关键型 AI 推理的关键因素,包括模型性能、高效的服务基础设施和强大的编排能力。