PulseAugur
实时 06:16:29
实体 Slurm

Slurm

PulseAugur coverage of Slurm — every cluster mentioning Slurm across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 3 条
  1. TOOL · CL_44361 ·

    Together AI 推出面向 AI 开发的自助式 GPU 集群

    Together AI 推出了 Together Instant Clusters,一项提供现成可用、自助式 GPU 集群以支持 AI 开发和部署的新服务。该服务旨在简化设置多节点 GPU 基础设施的复杂过程,允许用户通过 API、CLI 或控制台在几分钟内配置包含数百个 GPU 的集群。该服务包括用于分布式训练和推理的预配置组件,支持 NVIDIA 的最新 GPU 架构和高性能网络解决方案。

  2. RESEARCH · CL_27327 ·

    Hugging Face and AWS Detail Foundation Model Infrastructure

    Hugging Face and AWS have collaborated to detail the infrastructure required for training and running large foundation models. The blog post outlines a layered architecture, emphasizing the interplay between AWS's compu…

  3. TOOL · CL_47634 ·

    Character.ai 将 SLURM 调度器与 Kubernetes 集成以支持 GPU 研究

    Character.ai 开发了一个名为 Slonk 的内部系统,该系统将传统的 SLURM 调度器与 Kubernetes 集成,用于管理 GPU 研究集群。该系统旨在为研究人员提供熟悉的 SLURM 用户体验,包括公平队列和群体调度等功能,同时利用 Kubernetes 的操作优势,如编排、健康检查和自动扩缩容。Slonk 将 SLURM 节点视为 Kubernetes Pod,从而能够实现跨异构集群和云的高效资源共享和管理。