研究人员开发了两种新颖的方法 MSET 和 CEP,以增强大规模深度学习模型在硬件故障方面的可靠性。MSET 选择性地保护 CNN 和 ViT 参数中最易受影响的位,而 CEP 为所有位提供细粒度保护。与传统的 ECC 方法相比,这两种方法都展示了更高的可靠性,其中 MSET 通过关注其 FP16 和 FP32 表示中的最高指数位,在 ViT 方面显示出特别的潜力。与传统的 ECC 相比,这些新技术提供了显著的可靠性改进,同时具有更低的内存、面积和延迟开销。 AI
影响 增强了深度学习模型在安全关键应用中的可靠性,有可能减少与硬件故障相关的故障。
排序理由 提出深度学习模型可靠性新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →