PulseAugur
实时 17:37:11
English(EN) Effective and Memory-Efficient Alternatives to ECC for Reliable Large-Scale DNNs

新方法提升深度神经网络可靠性,优于 ECC

研究人员开发了两种新颖的方法 MSETCEP,以增强大规模深度学习模型在硬件故障方面的可靠性。MSET 选择性地保护 CNNViT 参数中最易受影响的位,而 CEP 为所有位提供细粒度保护。与传统的 ECC 方法相比,这两种方法都展示了更高的可靠性,其中 MSET 通过关注其 FP16 和 FP32 表示中的最高指数位,在 ViT 方面显示出特别的潜力。与传统的 ECC 相比,这些新技术提供了显著的可靠性改进,同时具有更低的内存、面积和延迟开销。 AI

影响 增强了深度学习模型在安全关键应用中的可靠性,有可能减少与硬件故障相关的故障。

排序理由 提出深度学习模型可靠性新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新方法提升深度神经网络可靠性,优于 ECC

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Jaan Raik ·

    Effective and Memory-Efficient Alternatives to ECC for Reliable Large-Scale DNNs

    Modern Deep Learning (DL) workloads are increasingly deployed in safety-critical domains, such as automotive systems and hyperscale data centers, where transient hardware faults pose a serious threat to system reliability. These workloads are highly memory-intensive, and their co…