PulseAugur
实时 14:36:19
实体 Keda

Keda

PulseAugur coverage of Keda — every cluster mentioning Keda across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_71391 ·

    Kubernetes 算子实现 LLM 服务的缩减至零

    新的 Kubernetes 算子正在涌现,以解决运行大型语言模型的成本问题,特别是闲置 GPU 烧钱的问题。Hearth 是一个处于 alpha 阶段的算子,允许用户声明式地服务开源 LLM,并在不使用时将其缩减至零,在冷启动期间缓冲请求。另一种方法是构建一个使用 NVML 的 KEDA 外部扩展器,以实现基于实际 GPU 利用率的自动扩展,从而减少对 Prometheus 等完整指标堆栈的需求。