实体
NVML
NVML
PulseAugur coverage of NVML — every cluster mentioning NVML across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
3 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
新方法使用 GPU 遥测检测隐藏的机器学习训练
研究人员开发了一种使用图形处理单元 (GPU) 的零开销遥测来检测隐藏的机器学习训练的方法。该方法利用隐私保护的 NVML 遥测,该遥测可以观察计算的物理效应,而无需访问模型权重或训练数据等敏感数据。开发的分类器在识别训练工作负载方面达到了 98.2% 的准确率,并证明了其对抗对手伪装的有效性。
-
Kubernetes 算子实现 LLM 服务的缩减至零
新的 Kubernetes 算子正在涌现,以解决运行大型语言模型的成本问题,特别是闲置 GPU 烧钱的问题。Hearth 是一个处于 alpha 阶段的算子,允许用户声明式地服务开源 LLM,并在不使用时将其缩减至零,在冷启动期间缓冲请求。另一种方法是构建一个使用 NVML 的 KEDA 外部扩展器,以实现基于实际 GPU 利用率的自动扩展,从而减少对 Prometheus 等完整指标堆栈的需求。
-
NVIDIA 边缘 AI 硬件缺乏能源归因能力
一篇新论文指出了 NVIDIA 旗舰边缘 AI 硬件(特别是 ASUS Ascent GX10 系统中发现的 GB10 SoC)存在严重的能源可观测性差距。研究表明,当前硬件缺乏在进程级别归因能耗的必要遥测数据,而这对于理解 agentic AI 工作负载的能源成本至关重要。与 x86 平台不同,这种缺陷阻碍了准确的能源归因。该论文提出了能源归因 AI 的硬件需求规范,并建议了一个临时的校准桥梁。